2 cách phân biệt biến rời rạc và biến liên tục

2 cách phân biệt biến rời rạc và biến liên tục, trong nghiên cứu định lượng các bạn mới bắt đầu tiếp xúc với thống kê, các bạn luôn đau đầu về việc phân biệt giữa 2 biến liên tục và rời rạc; Trong nội dung bài viết này chúng tôi sẽ giúp các bạn dễ dàng phân biệt được nội dung trên bằng 2 cách định nghĩa và kinh nghiệm. Nói chung cái định nghĩa bao giờ cũng khó hiểu còn cái kinh nghiệm thì chỉ sơ qua là các bạn biết rồi.

Phân biệt biến rời rạc & biến liên tục

Trong toán học và thống kê , một biến định lượng có thể liên tục hoặc rời rạc nếu chúng thường thu được bằng cách đo hoặc đếm tương ứng. Nếu nó có thể nhận hai giá trị thực cụ thể sao cho nó cũng có thể nhận tất cả các giá trị thực giữa chúng (ngay cả các giá trị gần nhau một cách tùy ý), thì biến là liên tục trong khoảng đó . Nếu nó có thể nhận một giá trị sao cho có một khoảng trống không phải thập phân ở mỗi bên của nó không chứa giá trị nào mà biến có thể nhận, thì nó sẽ rời rạc xung quanh giá trị đó. Trong một số ngữ cảnh, một biến có thể rời rạc trong một số phạm vi của dãy số và liên tục trong các phạm vi khác.

Cách 1: Đinh nghĩa

Dữ liệu là số

Thì phân ra biến liên tục và biến rời rạc

Biến liên tục (Continuos variable)  là gì ?

Biến liên tục là biến có giá trị nhận được bằng cách đo lường, tức là biến có thể nhận một tập giá trị không đếm được .Ví dụ, một biến trên một phạm vi không trống của số thực là liên tục, nếu nó có thể nhận bất kỳ giá trị nào trong phạm vi đó. Lý do là bất kỳ phạm vi số thực nào giữa  a với b;  a ,b thuộc R  & a #b là không thể đếm được.

Phương pháp tính toán thường được sử dụng trong các bài toán trong đó các biến là liên tục, ví dụ trong các bài toán tối ưu hóa liên tục .

Trong lý thuyết thống kê , phân bố xác suất của các biến liên tục có thể được biểu diễn dưới dạng hàm mật độ xác suất .

Trong động lực học thời gian liên tục, thời gian biến thiên được coi là liên tục, và phương trình mô tả sự phát triển của một số biến số theo thời gian là một phương trình vi phân . Tốc độ thay đổi tức thời là một khái niệm được định nghĩa rõ ràng.

Biến rời rạc (Descretes variable)  là gì ?

Ngược lại, một biến là một biến rời rạc nếu và chỉ khi tồn tại sự tương ứng 1-1 giữa biến này và thuộc N , tập hợp các số tự nhiên . Nói cách khác; Một biến rời rạc trong một khoảng giá trị thực cụ thể là một biến mà đối với bất kỳ giá trị nào trong phạm vi mà biến được phép sử dụng, sẽ có một khoảng cách nhỏ nhất dương đến giá trị cho phép khác gần nhất. Số lượng giá trị được phép là hữu hạn hoặc có thể đếm được vô hạn . Ví dụ phổ biến là các biến phải là số nguyên, số nguyên không âm, số nguyên dương hoặc chỉ các số nguyên 0 và 1.

Các phương pháp giải tích không dễ dàng giải quyết các vấn đề liên quan đến các biến số rời rạc. Ví dụ về các vấn đề liên quan đến các biến rời rạc bao gồm lập trình số nguyên .

Trong thống kê, phân bố xác suất của các biến rời rạc có thể được biểu diễn dưới dạng hàm khối lượng xác suất .

Trong động lực học thời gian rời rạc , thời gian biến đổi được coi là rời rạc, và phương trình tiến hóa của một số biến số theo thời gian được gọi là phương trình sai phân .

Trong kinh tế lượng và nói chung là trong phân tích hồi quy , đôi khi một số biến có liên quan thực nghiệm với nhau là 0-1 biến, chỉ được phép nhận hai giá trị đó. Một biến kiểu này được gọi là biến giả . Nếu biến phụ thuộc là một biến giả, thì hồi quy logistic hoặc hồi quy Probit thường được sử dụng.

Dữ liệu phân loại (Catelogical variable)  là gì ?

Trong thống kê , một biến phân loại (còn được gọi là biến định tính ) là một biến có thể đảm nhận một trong số các giá trị có thể có giới hạn và thường cố định, chỉ định từng cá nhân hoặc đơn vị quan sát khác cho một nhóm cụ thể hoặc danh mục danh nghĩa trên cơ sở của một số thuộc tính định tính . Trong khoa học máy tính và một số ngành của toán học, các biến phân loại được gọi là kiểu liệt kê hoặc kiểu liệt kê . Thông thường (mặc dù không có trong bài viết này), mỗi giá trị có thể có của một biến phân loại được gọi là một mức . Các phân phối xác suất kết hợp với một biến phân loại ngẫu nhiên được gọi là phân phối phân loại .

Dữ liệu phân loại là kiểu dữ liệu thống kê bao gồm các biến phân loại hoặc dữ liệu đã được chuyển đổi thành dạng đó, ví dụ như dữ liệu được nhóm . Cụ thể hơn, dữ liệu phân loại có thể thu được từ các quan sát được tạo ra từ dữ liệu định tính được tóm tắt dưới dạng số đếm hoặc lập bảng chéo , hoặc từ các quan sát về dữ liệu định lượng được nhóm lại trong các khoảng thời gian nhất định. Thông thường, dữ liệu phân loại thuần túy được tóm tắt dưới dạng một bảng dự phòng. Tuy nhiên, đặc biệt khi xem xét phân tích dữ liệu, người ta thường sử dụng thuật ngữ “dữ liệu phân loại” để áp dụng cho các tập dữ liệu, trong khi chứa một số biến phân loại, cũng có thể chứa các biến không phân loại.

Dữ liệu phân loại thì chia biến ra thành 2 loại là biến rời rạc ngâu nhiên với biến rời rạc thứ bậc

Biến rời rạc ngẫu nhiên ( nominal / random descretes variable)

Biến ngẫu nhiên rời rạc là biến có thể chỉ nhận một số lượng có thể đếm được các giá trị riêng biệt như 0,1,2,3,4, …….. Các biến ngẫu nhiên rời rạc thường là (nhưng không nhất thiết) là số đếm. Nếu một biến ngẫu nhiên chỉ có thể nhận một số hữu hạn các giá trị phân biệt, thì nó phải là biến rời rạc. Ví dụ về các biến ngẫu nhiên rời rạc bao gồm số lượng trẻ em trong một gia đình, số lần đến rạp chiếu phim vào tối thứ Sáu, số bệnh nhân trong cuộc phẫu thuật của bác sĩ, số bóng đèn bị lỗi trong một hộp mười.

Phân phối xác suất của một biến ngẫu nhiên rời rạc là một danh sách các xác suất được liên kết với mỗi giá trị có thể có của nó. Đôi khi nó còn được gọi là hàm xác suất hoặc hàm khối lượng xác suất.

Biền rời rạc thứ bậc (ordinal)

Một biến thứ tự tương tự như một biến phân loại. Sự khác biệt giữa hai loại là có thứ tự rõ ràng của các danh mục. Ví dụ: giả sử bạn có một tình trạng kinh tế có thể thay đổi, với ba loại (thấp, trung bình và cao). Ngoài việc có thể phân loại mọi người thành ba loại này, bạn có thể sắp xếp các loại là thấp, trung bình và cao. Bây giờ hãy xem xét một biến số như trải nghiệm giáo dục (với các giá trị như tốt nghiệp tiểu học, tốt nghiệp trung học, một số người tốt nghiệp đại học và cao đẳng). Chúng cũng có thể được đặt hàng khi tốt nghiệp tiểu học, trung học, một số đại học và cao đẳng. Mặc dù chúng ta có thể sắp xếp các giá trị này từ thấp nhất đến cao nhất, khoảng cách giữa các giá trị có thể không giống nhau trên các cấp của các biến.

Giả sử chúng tôi ấn định điểm 1, 2, 3 và 4 đến bốn cấp độ trải nghiệm giáo dục này và chúng tôi so sánh sự khác biệt về trình độ học vấn giữa nhóm một và hai với sự khác biệt về kinh nghiệm giáo dục giữa nhóm hai và ba, hoặc sự khác biệt giữa loại ba và bốn. Sự khác biệt giữa loại một và hai (tiểu học và trung học) có lẽ lớn hơn nhiều so với sự khác biệt giữa hai và ba (trung học và một số trường đại học). Trong ví dụ này, chúng ta có thể sắp xếp những người theo trình độ kinh nghiệm học vấn nhưng quy mô của sự khác biệt giữa các danh mục là không nhất quán (vì khoảng cách giữa các danh mục một và hai lớn hơn so với các danh mục hai và ba). Nếu các danh mục này cách đều nhau, thì biến đó sẽ là một biến khoảng.

Các phân biệt biến rời rạc biến liên tục
Cách phân biệt biến rời rạc và liên tục

Cách 2: Kinh nghiệm

Nếu phân chia thì có nhiều cách phân chia ở đây chúng tôi sẽ hướng dẫn các bạn phân theo hướng thực tế ứng dụng:

Biến liên tục

  • Là những dữ liệu chia nhỏ ra mà vẫn có ý nghĩa

Biến rời rạc / Biến phân loại

  • Là những dữ liệu không thể phân nhỏ, nếu phân nhỏ thì không thể có ý nghĩa

Biến rời rạc ngẫu nhiên

  • Là dữ liệu rời rạc ngẫu nhiên không có thứ tự

Biến rời rạc thứ bậc

  • Là dữ liệu rời rạc và có sắp xếp thứ tự

Ví dụ ứng dụng

Ví dụ 1: Lương của tôi

Lương của tôi là 8 triệu đồng một tháng, nếu tháng này tôi đi làm trễ thì bị trừ đi 200k còn lại 7,8 triệu. Tới đây bạn nghe có hợp lí không ? Tôi thấy hợp lí rồi đó, dữ liệu có thể chia nhỏ mà vẫn hợp lí, đây là biến định lượng.

Ví dụ 2 : Giới tính của tôi

Thế giới này có 2 giới tính là nam hoặc nữ ( các bạn đừng nói với tôi là giới tính thứ 3 nha, tôi căn cứ vào cccd), tôi gán giá trị luôn: 0 là nữ và 1 là nam; Bây giờ tôi nam ” quá trời nam tính” vậy giá trị của tôi là 1.5 nam; Bạn nghe có hợp lí không, nó không hợp lí vậy là đây là biến rời rạc / biến phân loại. ( Biến phân loại là biến rời rạc)

Ví dụ 3: Thứ tự sinh của tôi

Nhà tôi có 4 anh em, tôi sinh thứ 3 ( Trong miền nam chỉ có thứ 2, thứ 3, thứ 4 , thứ 5), bây giờ tôi làm việc quá dở nên tôi xuống thứ tự là thứ 4; Bạn nghe có hợp lí không, không hợp lí rồi như vậy đây là biến rời rạc và có thứ tự.

Tóm lại 2 cách phân biệt biến rời rạc & liên tục

Nếu như bạn đọc lý thuyết thì cũng có nhiều bạn không nắm rõ vấn đề, nhưng khi làm ví dụ bằng kinh nghiệm thì các bạn dễ dàng phân chia được các loại biến này, tôi nghĩ nếu các bạn chịu khó bỏ ra 1h để lấy các ví dụ xung quanh mình ra, để làm phân tích;  Thì những vấn đề  về phân biệt biến rời rạc và biến liên tục không thể nào làm khó bạn được.

Trả lời

Email của bạn sẽ không được hiển thị công khai.