TCVN 9600:2013 Tiêu chuẩn quốc gia về Lấy mẫu ngẫu nhiên và quy trình ngẫu nhiên hóa

TIÊU CHUẨN QUỐC GIA
TCVN 9600 : 2013
ISO 24153 : 2009
LẤY MẪU NGẪU NHIÊN VÀ QUY TRÌNH NGẪU NHIÊN HÓA
Random sampling and randomization procedures
Lời nói đầu
TCVN 9600:2013 hoàn toàn tương đương với ISO 24153:2009;
TCVN 9600:2013 do Ban Kỹ thuật tiêu chuẩn quốc gia TCVN/TC 69 Ứng dụng các phương pháp thống kê biên soạn,Tổng Cục Tiêu chuẩn và Đo lường Chất lượng đề nghị, Bộ Khoa học và Công nghệ công bố.
Lời giới thiệu
Lấy mẫu ngẫu nhiên và quy trình ngẫu nhiên là cơ sở để xác nhận giá trị của nhiều phương pháp thống kê sử dụng trong thử nghiệm, dù là cho mục đích kiểm soát chất lượng công nghiệp và cải tiến hay cho thiết kế thực nghiệm trong lĩnh vực y tế, sinh học, nông nghiệp hay lĩnh vực cụ thể khác. Nhiều tiêu chuẩn thống kê đề cập đến việc tiến hành thử nghiệm như vậy. Đặc biệt, tất cả các tiêu chuẩn lấy mẫu chấp nhận dưới đây đều được thiết kế trên tiền đề là lấy mẫu ngẫu nhiên được sử dụng để lựa chọn đơn vị lấy mẫu cần thiết ứng với bố trí lô:
TCVN 7790 (ISO 2859) (tất cả các phần), Qui trình lấy mẫu để kiểm tra định tính
TCVN 8243 (ISO 3951) (tất cả các phần), Qui trình lấy mẫu để kiểm tra định lượng
TCVN 9601 (ISO 8422), Phương án lấy mẫu liên tiếp để kiểm tra định tính
ISO 8423, Phương án lấy mẫu liên tiếp để kiểm tra định lượng phần trăm không phù hợp (đã biết độ lệch chuẩn)
ISO 13448 (tất cả các phần), Qui trình lấy mẫu chấp nhận dựa trên phân bổ nguyên tắc ưu tiên (APP)
ISO 14560, Qui trình lấy mẫu chấp nhận định tính – Mức chất lượng qui định về số cá thể không phù hợp trên một triệu
ISO 18414, Qui trình lấy mẫu chấp nhận định tính – Hệ thống lấy mẫu chấp nhận không dựa trên nguyên tắc tin cậy đối với kiểm soát chất lượng đầu ra
ISO 21247, Hệ thống lấy mẫu chấp nhận không kết hợp và qui trình kiểm soát quá trình để chấp nhận sản phẩm
Ngoài ra, TCVN 7790-3 (ISO 2859-3) và ISO 21247 bao gồm các qui định đối với lấy mẫu ngẫu nhiên được áp dụng để xác định xem lô có cần kiểm tra hoặc không áp dụng qui trình lấy mẫu lô cách quãng hay không, đồng thời để quyết định đơn vị nào cần kiểm tra từ một quá trình sản xuất trong phương án lấy mẫu liên tục, một cách tương ứng. Do đó, điều quan trọng là hiệu lực của tất cả các tiêu chuẩn trên để áp dụng lấy mẫu ngẫu nhiên hiệu quả.
Mặc dù các nguyên tắc của tiêu chuẩn này có thể áp dụng chung trong trường hợp yêu cầu lấy mẫu ngẫu nhiên và có thể xác định rõ đơn vị lấy mẫu, ưu tiên trên cơ sở cá thể riêng rẽ, nhưng có nhiều tình huống trong đó vật liệu quan tâm không được xác định là cá thể riêng rẽ, như trong trường hợp vật liệu dạng đống. Trong tình huống này, người sử dụng cần tham khảo tiêu chuẩn ISO sau đây để có hướng dẫn thích hợp:
ISO 11648 (tất cả các phần), Khía cạnh thống kê của mẫu lấy từ vật liệu dạng đống.

LẤY MẪU NGẪU NHIÊN VÀ QUY TRÌNH NGẪU NHIÊN HÓA
Random sampling and randomization procedures
1. Phạm vi áp dụng
Tiêu chuẩn này qui định các quy trình lấy mẫu ngẫu nhiên và ngẫu nhiên hóa. Nhiều phương pháp được đưa ra, bao gồm cả các phương pháp dựa trên thiết bị cơ khí, bảng số ngẫu nhiên và thuật toán trên máy tính xách tay.
Tiêu chuẩn này áp dụng trong trường hợp quy định, hợp đồng hay tiêu chuẩn khác yêu cầu sử dụng lấy mẫu ngẫu nhiên hay ngẫu nhiên hóa. Các phương pháp áp dụng cho các trường hợp như
a) lấy mẫu chấp nhận các đơn vị riêng rẽ để kiểm tra theo lô,
b) lấy mẫu cho mục đích khảo sát,
c) đánh giá kết quả của hệ thống quản lý chất lượng, và
d) chọn đơn vị thử nghiệm, phân bổ cách xử lý chúng và xác định thứ tự đánh giá trong tiến hành các thiết kế thực nghiệm.
Ngoài ra, tiêu chuẩn còn có các thông tin để hỗ trợ việc đánh giá hay xem xét bên ngoài khác các kết quả lấy mẫu ngẫu nhiên hay ngẫu nhiên hóa theo yêu cầu của nhân sự quản lý chất lượng hay cơ quan chế định.
Tiêu chuẩn này không cung cấp hướng dẫn như quy trình lấy mẫu ngẫu nhiên hay ngẫu nhiên hóa thích hợp để sử dụng cho tình huống thực nghiệm cụ thể bất kỳ hoặc đưa ra hướng dẫn về việc lựa chọn chiến lược lấy mẫu hay xác định cỡ mẫu. Cần tham khảo các tiêu chuẩn khác (như liệt kê trong phần Lời giới thiệu) hoặc các tài liệu viện dẫn hợp lệ hướng dẫn về vấn đề này.
2. Tài liệu viện dẫn
Tài liệu viện dẫn dưới đây rất cần thiết cho việc áp dụng tiêu chuẩn này. Đối với các tài liệu ghi năm công bố thì áp dụng bản được nêu. Đối với các tài liệu không ghi năm công bố thì áp dụng bản mới nhất, bao gồm cả các sửa đổi.
TCVN 7870-2 (ISO 80000-2), Đại lượng và đơn vị - Phần 2: Dấu và ký hiệu toán học sử dụng trong khoa học tự nhiên và công nghệ
TCVN 8244-1 (ISO 3534-1), Thống kê học – Từ vựng và ký hiệu – Phần 1: Thuật ngữ chung và thống kê thuật ngữ dùng trong xác suất
TCVN 8244-2 (ISO 3534-2), Thống kê học – Từ vựng và ký hiệu – Phần 2: Thống kê ứng dụng
ISO 3534-3, Statistics – Vocabulary and symbols – Part 3: Design of experiments (Thống kê học – Từ vựng và ký hiệu – Phần 3: Thiết kế thực nghiệm)
3. Thuật ngữ, định nghĩa và ký hiệu
Tiêu chuẩn này áp dụng các thuật ngữ và định nghĩa trong TCVN 8244-1 (ISO 3534-1),TCVN 8244-2 (ISO 3534-2), ISO 3534-3 và các thuật ngữ, định nghĩa dưới đây.
3.1. Thuật ngữ và định nghĩa
3.1.1. Chùm (cluster)
Bộ phận của tổng thể (3.1.6) chia tách thành các nhóm đơn vị mẫu (3.1.13) tách biệt nhau theo một cách thức nhất định.
[TCVN 8244-2:2010 (ISO 3534-2:2006), 1.2.28]
3.1.2. Lấy mẫu chùm (cluster sampling)
Phép lấy mẫu (3.1.12) trong đó mẫu ngẫu nhiên (3.1.8) của các chùm (3.1.1) được chọn và tất cả các đơn vị mẫu (3.1.13) tạo thành chùm bao gồm trong mẫu (3.1.11).
TCVN 8244-2:2010 (ISO 3534-2:2006), 1.3.9]
3.1.3. Xáo trộn (derangement)
Hoán vị hoàn toàn (complete permutation)
Hoán vị các thành phần trong đó không một thành phần nào còn giữ nguyên vị trí ban đầu trong tập hợp (ví dụ {3, 1, 2} là hoán vị của {1, 2, 3}).
3.1.4. Lô (lot)
Bộ phận xác định của tổng thể (3.1.6) cấu thành trong các điều kiện về cơ bản giống với tổng thể xét về mục đích lấy mẫu (3.1.12).
CHÚ THÍCH: Ví dụ, mục đích lấy mẫu có thể để xác định khả năng chấp nhận lô hoặc để ước lượng giá trị trung bình của một đặc trưng cụ thể.
TCVN 8244-2:2010 (ISO 3534-2:2006), 1.2.4]
3.1.5. Lấy mẫu nhiều tầng (multistage sampling)
Phép lấy mẫu (3.1.12) trong đó mẫu (3.1.11) được chọn theo tầng, các đơn vị mẫu(3.1.13) tại mỗi tầng được lấy từ đơn vị mẫu lớn hơn được chọn ở tầng trước đó.
CHÚ THÍCH: Lấy mẫu nhiều tầng khác với lấy mẫu nhiều lần. Lấy mẫu nhiều lần là lấy mẫu theo nhiều tiêu chí đồng thời.
TCVN 8244-2:2010 (ISO 3534-2:2006), 1.3.10]
3.1.6. Tổng thể (population)
<tham chiếu> toàn bộ các cá thể được xem xét.
TCVN 8244-2:2010 (ISO 3534-2:2006), 1.2.1]
3.1.7. Lấy mẫu ngẫu nhiên giả độc lập (pseudo-independent random sampling)
Lấy mẫu (3.1.12) trong đó mẫu (3.1.11) gồm n đơn vị mẫu (3.1.13) được lấy từ tổng thể(3.1.6) theo bảng số ngẫu nhiên hoặc thuật toán trên máy tính được thiết kế sao cho mỗi tổ hợp có thể có của n đơn vị mẫu có một xác suất được lấy cụ thể (xem thêm 4.4).
3.1.8. Mẫu ngẫu nhiên (random sample)
Mẫu (3.1.11) chọn bằng phép lấy mẫu ngẫu nhiên (3.1.9).
TCVN 8244-2:2010 (ISO 3534-2:2006), 1.2.25]
3.1.9. Lấy mẫu ngẫu nhiên (random sampling)
Phép lấy mẫu (3.1.12) trong đó có một mẫu (3.1.11) gồm n đơn vị mẫu (3.1.13) được lấy từ một tổng thể (3.1.6) sao cho mỗi tổ hợp có thể có của đơn vị mẫu có một xác suất được lấy cụ thể.
TCVN 8244-2:2010 (ISO 3534-2:2006), 1.3.5]
3.1.10. Ngẫu nhiên hóa (randomization)
Quá trình nhờ đó tập hợp các cá thể được đặt theo một trật tự ngẫu nhiên.
CHÚ THÍCH: Nếu từ một tổng thể (3.1.6) gồm các số tự nhiên từ 1 đến n, các số được lấy ngẫu nhiên (nghĩa là theo cách thức tất cả các số đều có cơ hội được lấy như nhau), từng số một, lần lượt, không hoàn lại, cho đến khi hết tổng thể, các số này được gọi là lấy “theo thứ tự ngẫu nhiên”.
Nếu n số này được liên kết trước với n đơn vị riêng biệt hay n xử lý riêng biệt mà sau đó được sắp xếp theo thứ tự các số được lấy thì thứ tự của các đơn vị hay xử lý đó được coi là được ngẫu nhiên hóa.
3.1.11. Mẫu (sample)
Tập hợp con của tổng thể (3.1.6) bao gồm một hoặc nhiều đơn vị mẫu (3.1.13).
TCVN 8244-2:2010 (ISO 3534-2:2006), 1.2.17]
3.1.12. Lấy mẫu (sampling)
Hoạt động lấy hoặc thành lập một mẫu (3.1.11).
TCVN 8244-2:2010 (ISO 3534-2:2006), 1.3.1]
3.1.13. Đơn vị mẫu (sampling unit)
Đơn vị (unit)
Một trong các thành phần riêng lẻ hợp thành tổng thể (3.1.6).
CHÚ THÍCH 1: Đơn vị mẫu có thể gồm một hoặc nhiều cá thể, ví dụ một bao diêm, nhưng sẽ bao hàm một liên kết quả thử.
CHÚ THÍCH 2: Đơn vị mẫu có thể gồm các cá thể rời rạc hoặc một lượng vật liệu dạng đống xác định.
TCVN 8244-2:2010 (ISO 3534-2:2006), 1.2.14]
3.1.14. Lấy mẫu có hoàn lại (sampling with replacement)
Lấy mẫu (3.1.12) trong đó mỗi đơn vị mẫu (3.1.13) được lấy ra, quan trắc, rồi được trả về tổng thể (3.1.6) trước khi lấy đơn vị mẫu tiếp theo.
TCVN 8244-2:2010 (ISO 3534-2:2006), 1.3.15]
3.1.15. Lấy mẫu không hoàn lại (sampling without replacement)
Lấy mẫu (3.1.12) trong đó mỗi đơn vị mẫu (3.1.13) chỉ được lấy ra từ tổng thể (3.1.6) một lần mà không được trả về tổng thể đó.
TCVN 8244-2:2010 (ISO 3534-2:2006), 1.3.16]
3.1.16. Giá trị xuất phát (seed)
Trị số hoặc tập hợp các giá trị để khởi đầu một thuật toán lấy mẫu ngẫu nhiên giả độc lập (3.1.7) hoặc để thiết lập điểm bắt đầu trong bảng số ngẫu nhiên.
3.1.17. Mẫu ngẫu nhiên đơn giản (simple random sample)
Mẫu (3.1.11) được chọn bằng cách lấy mẫu ngẫu nhiên đơn giản (3.1.18).
TCVN 8244-2:2010 (ISO 3534-2:2006), 1.2.24]
3.1.18. Lấy mẫu ngẫu nhiên đơn giản (simple random sampling)
Phép lấy mẫu (3.1.12) trong đó có một mẫu(3.1.11) gồm đơn vị mẫu (3.1.13) được lấy từ một tổng thể (3.1.6) sao cho tất cả các tổ hợp có thể có của n đơn vị mẫu có cùng xác suất được lấy ra.
TCVN 8244-2:2010 (ISO 3534-2:2006), 1.3.4]
3.1.19. Lấy mẫu phân lớp (stratified sampling)
Lấy mẫu (3.1.12) sao cho các phần mẫu (3.1.11) được lấy từ lớp (3.1.21) khác nhau và mỗi lớp được lấy ít nhất là một đơn vị mẫu (3.1.13).
TCVN 8244-2:2010 (ISO 3534-2:2006), 1.3.6]
3.1.20. Lấy mẫu ngẫu nhiên đơn giản phân lớp (stratified simple random sampling)
Lấy mẫu ngẫu nhiên đơn giản (3.1.18) từ mỗi lớp (3.1.21).
TCVN 8244-2:2010 (ISO 3534-2:2006),  1.3.7]
3.1.21. Lớp (stratum)
Tổng thể con tách biệt và đầy đủ được xem là đồng nhất hơn về các đặc trưng nghiên cứu so với toàn bộ tổng thể (3.1.6).
TCVN 8244-2:2010 (ISO 3534-2:2006),  1.2.29]
3.2. Ký hiệu
Tiêu chuẩn này áp dụng dấu và ký hiệu toán học trong TCVN 7870-2 (ISO 80000-2) và các ký hiệu sau:
di                    con số thứ i hoặc giá trị mặt của đồng xu hay xúc sắc
N          cỡ lô
n          cỡ mẫu
ni                    cỡ của mẫu thứ i
U          biến thực ngẫu nhiên phân bố đều trên phạm vi mở (0, 1)
                giá trị thứ của biến 
j!          j giai thừa
éz ù       hàm trần nguyên của z (trả về số nguyên nhỏ nhất lớn hơn hoặc bằng giá trị thựcz)
ë û      hàm sàn nguyên của z (trả về phần nguyên của giá trị thực z)
4. Quy định chung
4.1. Lấy mẫu ngẫu nhiên là điều kiện tiên quyết để áp dụng đúng hầu hết các phương án lấy mẫu trong ứng dụng công nghiệp. Tương tự, ngẫu nhiên hóa, sử dụng các nguyên tắc lấy mẫu ngẫu nhiên, là không thể thiếu được khi thực hiện các thiết kế thực nghiệm, vì nó làm tăng hiệu lực nội tại của thực nghiệm, cho phép sử dụng các phương pháp thống kê trong giải thích các kết quả thực nghiệm. Mục tiêu của lấy mẫu ngẫu nhiên là cung cấp phương tiện áp dụng các kết quả của lý thuyết xác suất vào các vấn để thực tiễn, trong khi tránh được mọi dạng độ chệch bất kỳ. Mục tiêu này không đạt được khi sử dụng các loại lấy mẫu nhất định khác. Ví dụ, lấy mẫu dựa trên các khái niệm như trực giác hay đánh giá của cá nhân, tính lộn xộn, hoặc theo hạn ngạch đều có độ chệch vốn có và kết quả dẫn đến sai lỗi nghiêm trọng trong quá trình ra quyết định mà không có điều kiện đánh giá rủi ro. Lấy mẫu ngẫu nhiên đồng xác suất nhằm loại trừ độ chệch như vậy bằng cách đảm bảo rằng mỗi đơn vị trong lô có cùng một xác suất được chọn (lấy mẫu có hoàn lại) hay, nói cách khác, mọi mẫu có thể trong cỡ mẫu cho trước lấy từ một lô có cùng xác suất được chọn (lấy mẫu không hoàn lại).
4.2. Trong phương án lấy mẫu ngẫu nhiên đồng xác suất có hoàn lại, xác suất một đơn vị cụ thể trong lô gồm N đơn vị được chọn ở lần lấy cho trước bất kỳ luôn là 1/N. Có Nnngẫu nhiên theo thứ tự có thể có của n đơn vị từ N đơn vị và, đầy đủ là, có (N + n – 1)! / [n! (N – 1)!] mẫu ngẫu nhiên không theo thứ tự khác nhau có thể gồm n đơn vị từ N đơn vị (xem chú thích bên dưới).
Theo phương án lấy mẫu ngẫu nhiên đơn giản không hoàn lại, xác suất một đơn vị trong lô được chọn ở lần lấy trước là 1/N đối với lần lấy đầu tiên, 1/(N – 1) đối với lần lấy thứ hai, 1/(N – 2) đối với lần thứ ba, và cứ tiếp tục như vậy. Nếu n đơn vị được chọn ngẫu nhiên từ lô gồm N đơn vị mà không hoàn lại, khi đó mỗi tổ hợp đơn vị có cùng một xác suất lựa chọn với mọi tổ hợp N đơn vị khác lấy n đơn vị mỗi lần. Số lượng mẫu gồm n đơn vị ngẫu nhiên không theo thứ tự xác suất khác nhau từ lô gồm N đơn vị là N!/(N-1)!, tương đương với số lượng tổ hợp gồm N đơn vị lấy n đơn vị mỗi lần . Điều đáng lưu ý khác là số lượng mẫu ngẫu nhiên theo thứ tự gồm n đơn vị được lấy không hoàn lại từ lô gồm N đơn vị là N! (N – n)! tương đương với số hoán vị có thể có gồm N đơn vị lấy nđơn vị mỗi lần. Cần chú ý là việc lấy mẫu ngẫu nhiên không hoàn lại là phương án lấy mẫu phổ biến nhất được sử dụng trong các ứng dụng lấy mẫu chấp nhận.
CHÚ THÍCH: Trong lấy mẫu có hoàn lại trên cơ sở mẫu gồm 3 đơn vị trong 5 đơn vị, danh mục {1, 1, 2}, {1, 2, 1} và {2, 1, 1} sẽ khác khi xét về thứ tự (và về kỹ thuật gọi là đa tập hợp) nhưng giống nhau nếu không xét đến thứ tự.
4.3. Mục tiêu của lấy mẫu ngẫu nhiên chỉ có thể đạt được bằng việc gắn với các quy trình chặt chẽ được thiết kế kỹ càng để đạt được mục đích của định nghĩa. Nhiều phương pháp được trình bày trong tiêu chuẩn này để thực thi mục tiêu này. Cụ thể là các phương pháp dùng thiết bị cơ khí giả định rằng đồng xu và xúc sắc không có độ chệch, được thiết kế sao cho mỗi mặt có cùng một xác suất xuất hiện trong quá trình ném hay tung và cách thức tung hay ném được thực hiện để không gây ra độ chệch. Hơn nữa, do những khác biệt lớn trong việc áp dụng nội tại các phương pháp lấy mẫu ngẫu nhiên trong máy tính cũng như hệ điều hành máy tính, ngôn ngữ lập trình và phần mềm (xem tài liệu tham khảo [9], [10], [12] và [13] về thông tin thêm), nên tiêu chuẩn này lựa chọn phương pháp tạo mẫu ngẫu nhiên bằng máy tính cầm tay. Ngoài ra,cần lưu ý là tất cả các phương pháp dưới đây đòi hỏi rằng mỗi đơn vị riêng rẽ trong lô được kết hợp trước với một số nhất định từ 1 đến N, sao cho các đơn vị lấy mẫu xác định là kết quả của phương pháp lấy mẫu ngẫu nhiên có thể thu được một cách rõ ràng từ lô đó.
4.4. Cuối cùng, để giảm khó khăn trong việc trình bày, tính từ “giả độc lập” sẽ thường được bỏ bớt khi đề cập đến quy trình hay phương pháp lấy mẫu ngẫu nhiên như vậy (xem tài liệu tham khảo [8]). Hơn nữa, tính từ “ngẫu nhiên” sẽ được sử dụng thường xuyên với nghĩa là danh từ mà nó bổ nghĩa (thường là số hoặc phép hoán vị) là đầu ra của quá trình tạo ra ngẫu nhiên số hay phép hoán vị đó. Ngoài ra, khi có các ví dụ, cỡ mẫu liên quan được giữ ở con số nhỏ với mục tiêu minh họa một cách đơn giản những khái niệm liên quan.
5. Lấy mẫu ngẫu nhiên – Phương pháp dùng thiết bị cơ khí
5.1. Phương pháp bình
5.1.1. Đặt N vật giống hệt nhau nhưng được đánh số khác nhau (ví dụ: vé, đồng tiền hay quả bóng) vào một chiếc bình để thể hiện rõ ràng mỗi trong số đơn vị trong lô đó rồi trộn kỹ các đồ vật đó.
5.1.2. Đối với lấy mẫu không hoàn lại, nhắm mắt chọn các đồ vật trong bình, từng vật một mà không trả lại vào bình rồi trộn lại các vật giữa các lần lấy liên tiếp, cho đến khi có được n đơn vị lấy mẫu mong muốn.
CHÚ THÍCH: Phương pháp này thường được sử dụng bởi các công ty xổ số.
5.1.3. Đối với lấy mẫu có hoàn lại, nhắm mắt chọn các đồ vật trong bình, từng vật một rồi trả lại bình sau mỗi lần lấy và trộn kỹ lại các vật giữa các lần lấy liên tiếp, cho đến khi có được n đơn vị lấy mẫu mong muốn. Sử dụng phương pháp này, cùng một đơn vị có thể xuất hiện trong mẫu nhiều hơn một lần.
5.2. Phương pháp đồng xu hay xúc sắc


TCVN 9600:2013, TCVN 9600:2013 Tiêu chuẩn quốc gia về Lấy mẫu ngẫu nhiên và quy trình ngẫu nhiên hóa, tcvn miễn phí, tiêu chuẩn việt nam

Đăng nhận xét

[blogger]

Author Name

Biểu mẫu liên hệ

Tên

Email *

Thông báo *

Được tạo bởi Blogger.