Cách tính trị số p trong thống kê

*

7

Kiểm định giả thiết thống kê cùng chân thành và ý nghĩa của trị số Phường (P-value)

7.1 Trị số P

Trong nghiên cứu công nghệ, ngoài các dữ khiếu nại thông qua số, biểu đồ dùng và hình hình họa, số lượng mà lại họ thường tuyệt gặp gỡ tuyệt nhất là trị số P (nhưng tiếng Anh Call là P-value). Trong các chương thơm sau đây, bạn đọc vẫn gặp mặt trị số P.. rất nhiều lần, và đại phần nhiều các suy luận so với thống kê, suy luận kỹ thuật phần đa nhờ vào trị số Phường. Do đó, trước khi bàn cho những phương thức so với thống kê bởi R, rất cần được bao gồm ý nghĩa sâu sắc của trị số này.

Trị số Phường. là một trong con số tỷ lệ, Tức là viết tắt chữ “probability value”. Chúng ta thường gặp gỡ đều tuyên bố được hẳn nhiên con số, chẳng hạn như “Kết trái phân tích cho thấy tỉ lệ gãy xương vào nhóm người bệnh được khám chữa bằng dung dịch Alendronate là 2%, rẻ hơn tỉ lệ thành phần trong nhóm bệnh nhân ko được chữa trị (5%), và mức độ khác hoàn toàn này còn có ý nghĩa sâu sắc thống kê lại (p = 0.01)”, hay như là một phát biểu nlỗi “Sau 3 tháng khám chữa, mức độ bớt áp suất ngày tiết trong nhóm người bị bệnh là 10% (p

Thật vậy, rất nhiều fan, không chỉ có tín đồ phát âm mà ngay cả chủ yếu những người sáng tác của rất nhiều bài bác báo khoa học, thiếu hiểu biết đúng ý nghĩa của trị số Phường. Theo một nghiên cứu và phân tích được ra mắt bên trên tập san nổi tiếng Statistics in Medicine <1>, người sáng tác cho biết thêm 85% những tác giả khoa học và bác sĩ nghiên cứu không hiểu biết tốt hiểu sai chân thành và ý nghĩa của trị số Phường. Thế thì, thắc mắc phải đề ra một biện pháp nghiêm chỉnh: Ý nghĩa của trị số P là gì? Để trả lời đến câu hỏi này, họ cần phải để ý qua quan niệm bội phản nghiệm và tiến trình của một phân tích kỹ thuật.

7.2 Giả thiết công nghệ với làm phản nghiệm

Một đưa thiết được xem là mang tính chất “khoa học” ví như giả thiết kia có tác dụng “bội phản nghiệm”. TheoKarl Popper, đơn vị triết học khoa học, Điểm sáng nhất để hoàn toàn có thể biệt lập thân một lí tmáu kỹ thuật thực thú với ngụy khoa học (pseudoscience) là ttiết khoa học luôn luôn có công dụng hoàn toàn có thể “ bị bác bỏ bỏ” (giỏi bị bội phản bác bỏ – falsified) bằng gần như thực nghiệm đơn giản dễ dàng. Ông Call đó là “tài năng phản bội nghiệm” (falsifiability, có tài liệu ghi là falsibility). Phép phản nghịch nghiệm là phương thơm giải pháp triển khai phần nhiều thực nghiệm chưa phải để xác minc nhưng để phê phán các lí tngày tiết khoa học, và hoàn toàn có thể coi phía trên nlỗi là 1 trong căn cơ cho công nghệ thực thú. Chẳng hạn như đưa thiết “Tất cả những quạ đa số màu sắc đen” có thể bị chưng bỏ giả dụ ta tìm ra tất cả một bé quạ red color.

Có thể xem qui trình bội nghịch nghiệm là một bí quyết học hỏi từ bỏ sai lầm. Khoa học tập phát triển cũng 1 phần béo là vì giao lưu và học hỏi trường đoản cú sai lầm cơ mà giới công nghệ không có bất kì ai căn năn cãi. cũng có thể xác minh nghiên cứu và phân tích khoa học nlỗi là một trong qui trình thí nghiệm mang thuyết, theo công việc sau đây:

Bước 1, nhà nghiên cứu và phân tích cần phải tư tưởng một mang ttiết đảo (null hypothesis), tức là một mang thuyết ngược lại với mọi gì mà lại nhà nghiên cứu và phân tích tin là sự việc thật. Thí dụ trong một nghiên cứu và phân tích lâm sàng, tất cả nhị nhóm căn bệnh nhân: một nhóm được điều trị bởi dung dịch A, cùng một nhóm được chữa bệnh bởi placebo, đơn vị phân tích rất có thể tuyên bố một mang tmáu đảo rằng sự hiệu nghiệm thuốc A tương tự với sự hiệu nghiệm của placebo (tức là thuốc A không tồn tại tính năng nhỏng mong muốn).

You watching: Cách tính trị số p trong thống kê

Cách 2, nhà nghiên cứu rất cần phải có mang một đưa ttiết phụ (alternative hypothesis), có nghĩa là một trả thuyết nhưng mà công ty nghiên cứu và phân tích suy nghĩ là sự thật, cùng điều cần phải “bệnh minh” bằng dữ kiện. Chẳng hạn nlỗi vào ví dụ bên trên phía trên, công ty nghiên cứu và phân tích có thể phát biểu trả tmáu phụ rằng dung dịch A có hiệu nghiệm cao hơn nữa placebo.

Bước 3, sau khoản thời gian vẫn thu thập vừa đủ phần lớn dữ kiện liên quan, công ty phân tích dùng một xuất xắc những phương pháp thống kê lại nhằm bình chọn coi trong nhì đưa tngày tiết bên trên, giả tngày tiết nào được xem là khả dĩ. Cách bình chọn này được thực hiện nhằm vấn đáp câu hỏi: trường hợp trả tmáu đảo đúng, thì tỷ lệ nhưng phần nhiều dữ khiếu nại thu thập được tương xứng với giả ttiết đảo là từng nào. Giá trị của phần trăm này thường xuyên được đề cập đến trong các báo cáo khoa học bởi kí hiệu “P value”. Điều phải để ý sinh hoạt đấy là nhà phân tích ko thí nghiệm đưa thuyết khác, mà lại chỉ thử nghiệm đưa thuyết đảo nhưng thôi.

Cách 4, ra quyết định gật đầu đồng ý tốt loại trừ mang tmáu đảo, bằng cách nhờ vào quý hiếm Xác Suất vào bước sản phẩm bố. Chẳng hạn nhỏng theo truyền thống lịch sử tuyển lựa trong một nghiên cứu y học, nếu quý giá Tỷ Lệ nhỏ hơn 5% thì bên phân tích sẵn sàng chuẩn bị bác bỏ quăng quật giả ttiết đảo: sự hiệu nghiệm của thuốc A khác với việc hiệu nghiệm của placebo. Tuy nhiên, trường hợp quý giá Tỷ Lệ cao hơn nữa 5%, thì công ty phân tích chỉ hoàn toàn có thể tuyên bố rằng chưa xuất hiện minh chứng tương đối đầy đủ nhằm bác quăng quật giả thuyết đảo, và vấn đề này không tồn tại nghĩa rằng trả tmáu hòn đảo là đúng, là sự việc thiệt. Nói một cách không giống, thiếu minh chứng không tức là không tồn tại vật chứng.

See more: Tốp 5 Bộ Phim Điện Ảnh Việt Nam 2016 : Những Sự Kiện Nổi Bật

Cách 5, nếu như mang thuyết hòn đảo bị bác vứt, thì nhà nghiên cứu mặc nhiên chấp thuận giả tngày tiết phú. Nhưng sự việc khởi đi từ bỏ phía trên, chính vì có tương đối nhiều đưa thuyết prúc khác biệt. Chẳng hạn nlỗi đối chiếu với mang tngày tiết prúc ban đầu (A khác với Placebo), đơn vị phân tích rất có thể đặt ra nhiều mang tngày tiết phú khác nhau nhỏng thuốc sự kiến hiệu của dung dịch A cao hơn nữa Placebo 5%, 10% xuất xắc nói chung X%. Nói kết luận, một lúc đơn vị nghiên cứu chưng bỏ mang tngày tiết hòn đảo, thì giả ttiết prúc được thản nhiên thừa nhận, tuy nhiên công ty nghiên cứu và phân tích cần yếu khẳng định mang ttiết phụ nào là đúng với thực sự.

7.3 Ý nghĩa của trị số P. qua mô phỏng

Để phát âm ý nghĩa sâu sắc thực tế của trị số P.., bọn họ vẫn đem một ví dụ dễ dàng và đơn giản nhỏng sau:

lấy một ví dụ 1. Một thử nghiệm được tiến hành nhằm mày mò sở trường của tín đồ tiêu thú đối với nhì các loại coffe (hãy nhất thời call là cafe A và B). Các nhà nghiên cứu và phân tích mang đến 50 người tiêu dùng uống thử nhị nhiều loại coffe vào và một ĐK, và hỏi họ thích hợp một số loại coffe như thế nào. Kết quả cho thấy 35 bạn thích cafe A, cùng 15 bạn say mê cafe B. Vấn để đặt ra là qua hiệu quả này, các bên phân tích hoàn toàn có thể kết luận rằng cà phê các loại A rất được quan tâm hơn cafe B, giỏi công dụng trên chỉ là do thốt nhiên mà ra?

“Do bỗng nhiên cơ mà ra” Có nghĩa là theo phép tắc nhị phân, tài năng cơ mà tác dụng bên trên xảy ra là bao nhiêu? Do đó, lí tmáu Xác Suất nhị phân gồm phần áp dụng vào trường phù hợp này, bởi vì kết quả của nghiên cứu chỉ có hai “giá chỉ trị” (Hay là ham mê A, hoặc ưa thích B).

Nói theo ngữ điệu của phản nghịch nghiệm, đưa thiết đảo là nếu không có sự biệt lập về sở thích, Tỷ Lệ cơ mà một khách hàng ưu thích một nhiều loại cafe là 0.5. Nếu giả thiết này là đúng (tức p = 0.5, p nghỉ ngơi đây là xác suất thích cafe A), và nếu phân tích trên được lặp đi tái diễn (ví dụ điển hình như) 1000 lần, cùng những lần vẫn 50 người sử dụng, thì có bao nhiêu lần cùng với 35 khách hàng yêu chuộng cafe A? gọi chu kỳ nghiên cứu và phân tích cơ mà 35 (xuất xắc nhiều hơn) trong các 50 thích hợp cafe A là “thay đổi cố” X, nói theo ngữ điệu Phần Trăm, bọn họ mong mỏi kiếm tìm P(X | p=0.50) =?

Để vấn đáp thắc mắc này, bạn cũng có thể áp dụng hàm rbinom để tế bào rộp vị nhỏng nói bên trên thực chất của vấn đề là một phân phối nhị phân:

> bin

Trong lệnh trên, chúng ta đòi hỏi R tế bào rộp 1000 lần nghiên cứu và phân tích, các lần có 50 khách hàng, cùng theo giả thiết đảo, Phần Trăm ưa thích A là 0.50. Để biết công dụng của mô rộp kia, bọn họ áp dụng hàm table nlỗi sau:

> table(bin)

bin

14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33

34 35

2 3

Qua kết quả trên, bọn họ thấy trong số 1000 “nghiên cứu” kia, chỉ bao gồm 3 phân tích mà số khách hàng say đắm cafe A là 35 người (cùng với ĐK không có biệt lập thân hai loại cafe, giỏi nói đúng ra là trường hợp p =0.5). Nói bí quyết khác:

P(X ≥ 35 | p=0.50) = 3/1000 = 0.003

Chúng ta cũng hoàn toàn có thể thể hiện tần số bên trên bởi một biểu vật dụng tần số như sau:

*

Tất nhiên chúng ta có thể có tác dụng một mô rộp khác với mốc giới hạn tái thí nghiệm là 100.000 lần (nuốm vày 1000 lần) cùng tính phần trăm P(X ≥ 35 | p=0.50).

bin

> bin

> table(bin)

bin

11 12 13 14 15 16 17 18 19 20 21 22 23

24 25 26 27 28 29 30 31 32 33 34 35 36

37 38 39 40

31 5 7 1

Lần này, chúng ta có tương đối nhiều kỹ năng rộng (do mốc giới hạn mô bỏng tăng lên). Chẳng hạn nhỏng hoàn toàn có thể có nghiên cứu và phân tích tạo ra 11 người tiêu dùng (buổi tối thiểu) tốt 40 quý khách (tối đa) ưa thích cafe A. Nhưng họ mong muốn biết mốc giới hạn nghiên cứu và phân tích mà lại 35 người tiêu dùng trnghỉ ngơi lên phù hợp coffe A, và tác dụng bên trên mang lại bọn họ biết, Phần Trăm đó là:

> (223+98+21+5+7+1)/100000

<1> 0.00355

Nói cách khác, tỷ lệ P(X ≥ 35 | p=0.50) quá thấp (chỉ 0.3%), bọn họ bao gồm dẫn chứng khiến cho rằng kết quả bên trên hoàn toàn có thể ko bởi những yếu tố hốt nhiên gây nên; tức bao gồm một sự khác hoàn toàn về sở thích của người sử dụng so với hai nhiều loại cafe.

Con số P = 0.0035 đó là trị số P.. Theo một qui ước khoa học, toàn bộ những trị số Phường phải chăng hơn 0.05 (tức tốt hơn 5%) được xem là “significant”, Tức là “có chân thành và ý nghĩa thống kê”.

See more: Uống Nước Bưởi Ép Có Tác Dụng Gì ? Nước Ép Bưởi

Cần buộc phải nhấn mạnh vấn đề một đợt nữa nhằm hiểu ý nghĩa sâu sắc của trị số P. nhỏng sau: Mục đích của so với bên trên là nhằm mục đích trả lời câu hỏi: nếu nhị một số loại coffe có xác suất yêu chuộng đều nhau (p = 0.5, đưa thuyết đảo), thì tỷ lệ mà tác dụng bên trên (35 trong những 50 quý khách hàng thích A) xảy ra là bao nhiêu? Nói giải pháp không giống, kia chính là cách thức đi kiếm trị số Phường. Do đó, diễn dịch trị số Phường phải có ĐK, và điều kiện làm việc đây là p = 0.50. quý khách hàng gọi hoàn toàn có thể làm phân tích thêm với p = 0.6 xuất xắc p = 0.7 để xem công dụng không giống nhau thế nào.

Trong thực tiễn, trị số P có một tác động rất to lớn cho số phận của một bài báo công nghệ. đa phần tập san và bên khoa học coi một nghiên cứu kỹ thuật cùng với trị số Phường cao hơn 0.05 là một trong những “công dụng tiêu cực” (“negative result”) cùng bài báo hiện đang có thể bị lắc đầu đến công bố. Chính chính vì như thế mà so với đại phần nhiều đơn vị khoa học, con số “P 0.05, số phận bài xích báo và dự án công trình nghiên cứu và phân tích gồm cơ may lấn sân vào quên khuấy.

7.4 Vấn đề logic của trị số P

Nhưng đứng trên pmùi hương diện lí trí với công nghệ nghiêm túc, chúng ta có nên được đặt trung bình quan trọng vào trị số P như thế xuất xắc không? Câu vấn đáp là không. Trị số Phường có nhiều vấn đề, cùng bài toán phụ thuộc vào vào nó vào thừa khứ (cũng giống như hiện nay) đã biết thành rất nhiều fan phê phán gay gắt. Cái khi hữu kngày tiết lớn số 1 của trị số Phường là nó thiếu thốn tính súc tích. Thật vậy, trường hợp bọn họ cần cù chăm chú lại ví dụ bên trên, chúng ta có thể khái quát tiến trình của một phân tích y học tập (phụ thuộc trị số P) như sau:

Đề ra một trả tngày tiết chính (H+) Từ đưa tmáu chủ yếu, đặt ra một trả ttiết hòn đảo (H-) Tiến hành tích lũy dữ kiện (D) Phân tích dữ kiện: tính toán thù Tỷ Lệ D xảy ra giả dụ H- là sự việc thiệt. Nói theo ngôn ngữ tân oán tỷ lệ, công đoạn này đó là bdự tính toán trị số P. giỏi P(D | H-).

Vì nuốm, số lượng P tức là Tỷ Lệ của dữ kiện D xẩy ra giả dụ (nhận mạnh: “nếu”) đưa thuyết hòn đảo H- là việc thiệt. do đó, con số Phường không thẳng mang đến họ một ý niệm gì về sự thật của trả tngày tiết thiết yếu H; nó chỉ loại gián tiếp cung ứng minh chứng nhằm họ chấp nhận giả tmáu thiết yếu cùng bác quăng quật giả tngày tiết đảo.

Cái súc tích đằng sau của trị số Phường rất có thể được gọi nlỗi là 1 trong những tiến trình minh chứng hòn đảo ngược (proof by contradiction):

Mệnh đề 1: Nếu giả thuyết đảo là việc thật, thì dữ kiện này sẽ không thể xảy ra; Mệnh đề 2: Dữ kiện xảy ra; Mệnh đề 3 (kết luận): Giả thuyết hòn đảo quan yếu là sự việc thiệt.

Nếu giải pháp lập luận trên cực nhọc hiểu, chúng ta test xem một ví dụ rõ ràng nhỏng sau:

Nếu ông Tuấn bị tăng áp, thì ông thiết yếu tất cả triệu chứng triệu chứng rụng tóc (nhị hiện tượng kỳ lạ sinh học tập này sẽ không liên quan với nhau, không nhiều ra là theo kỹ năng và kiến thức y học hiện nay nay); Ông Tuấn bị rụng tóc; Do kia, ông Tuấn quan yếu bị tăng áp.

Trị số P, do đó, con gián tiếp phản ảnh phần trăm của mệnh đề 3. Và này cũng đó là một khiếm kngày tiết quan trọng của trị số P.., bởi vì số lượng Phường nó ước tính mức độ khả dĩ của dữ khiếu nại, chứ không nói đến chúng ta biết cường độ khả dĩ của một trả ttiết. Điều này làm cho vấn đề tư duy nhờ vào trị số Phường siêu xa vắng cùng với thực tiễn, xa vắng với công nghệ thực nghiệm. Trong kỹ thuật thực nghiệm, điều mà nhà phân tích hy vọng biết là cùng với dữ kiện mà người ta đạt được, tỷ lệ của trả tngày tiết chính là từng nào, chứ đọng bọn họ không muốn biết trường hợp trả ttiết hòn đảo là sự việc thiệt thì phần trăm của dữ khiếu nại là từng nào. Nói phương pháp khác với dùng kí hiệu trình bày trên, bên phân tích hy vọng biết P(H+ | D), chđọng không muốn biết P(D | H+) giỏi P(D | H-).

7.5. Vấn đề kiểm tra nhiều giả tngày tiết (multiple tests of hypothesis)

Nlỗi đang nói bên trên, phân tích y học là 1 trong những công đoạn thể nghiệm mang tmáu. Trong một nghiên cứu và phân tích, ít khi nào bọn họ thử nghiệm chỉ một mang tmáu tốt nhất, nhưng không hề ít đưa thuyết một lược. Chẳng hạn nlỗi trong một nghiên cứu và phân tích về mọt contact thân vitamin D và nguy hại gãy xương đùi, các nhà phân tích hoàn toàn có thể so với mối liên hệ tương quan giữa Vi-Ta-Min D với tỷ lệ xương (bone mineral density), thân Vi-Ta-Min D và nguy cơ gãy xương theo từng giới tính, từng nhóm tuổi, tuyệt so sánh theo những công năng lâm sàng của bệnh nhân, v.v… (Xem ví dụ bên dưới đây). Mỗi một so sánh như thế có thể coi là một thể nghiệm mang tngày tiết. Ở đây, chúng ta phải đối diện cùng với vấn đề những giả tngày tiết (multiple tests of hypothesis xuất xắc còn gọi là multiple comparisons).

Bảng 2. Phân tích công dụng của Vi-Ta-Min D với calcium theo công dụng của bệnh nhân

Đặc tính căn bệnh nhân Nhóm được khám chữa bằng calcium cùng Vi-Ta-Min D 1 Nhóm giả dược (placebo) 1 Tỉ số nguy hại (relative sầu risk) và khoảng tin tưởng 95% 2 Độ tuổi

50-59

60-69

70-79 29 (0.06) 53 (0.09)

93 (0.44) 13 (0.03) 71 (0.13)

115 (0.54) 2,17 (1.13-4.18) 0.74 (0.52-1.06)

0.82 (0.62-1.08) Tử trọng cơ thể (Body mass index) >30

69 (0.20)

63 (0.14)

43 (0.09)

66 (0.19)

74 (0.16)

59 (0.13)

1.05 (0.75-1.47)

0.87 (0.62-1.22)

0.73 (0.49-1.09) Hút dung dịch lá Không hút ít thuốc

Hiện hút ít thuốc 159 (0.14)

14 (0.14) 178 (0.15)

16 (0.17) 0.90 (0.7đối chọi.11)

0.85 (0.41-1.74)

Chú thích: 1 số ko kể ngoặc là số người bị bệnh bị gãy xương đùi vào thời gian theo dõi (7 năm) cùng số vào ngoặc là tỉ lệ gãy xương tính bởi Xác Suất tưng năm. 2 Tỉ số nguy cơ tiềm ẩn kha khá (giỏi relative sầu risk – RR – đang phân tích và lý giải vào một chương sau) được ước tính bằng phương pháp rước tỉ lệ gãy xương trong team can thiệp phân chia mang lại tỉ lệ vào team giả dược; nếu khoảng chừng tin cẩn 95% bao gồm một thì cường độ biệt lập giữa 2 đội không tồn tại ý nghĩa thống kê; nếu như khoảng tin yêu 95% ko gồm một thì mức độ khác hoàn toàn thân 2 đội được xem như là có ý nghĩa sâu sắc thống kê (tốt p

Xin đề cập lại rằng trong mỗi lần thí nghiệm một đưa tngày tiết, họ chấp nhận một không nên sót 5% (trả dụ chúng ta đồng ý tiêu chuẩn p = 0.05 nhằm tuyên tía bao gồm ý nghĩa sâu sắc hay không gồm ý nghĩa sâu sắc thống kê). Vấn đề đặt ra là trong toàn cảnh thí điểm những mang ttiết là nlỗi sau: ví như trong những n xem sét, bọn họ tuyên ổn tía k phân tách “tất cả chân thành và ý nghĩa thống kê” (Tức là p

Để trả lời thắc mắc này họ đang bước đầu bởi một ví dụ đơn giản. Mỗi thử nghiệm bọn họ chấp nhận một Xác Suất sai lầm là 0.05. Nói giải pháp khác, chúng ta tất cả xác suất đúng là 0.95. Nếu bọn họ thể nghiệm 3 giả tmáu, Xác Suất cơ mà bọn họ đúng cả tía là : 0.95 x 0.95 x 0.95 = 0.8574. bởi vậy, xác xuất tất cả ít nhất một sai trái vào bố tuyên ổn bố “bao gồm ý nghĩa thống kê” là: 1 – 0.8574 = 0.1426 (tức khoảng tầm 14%).

Nói chung, ví như bọn họ thí nghiệm n đưa tmáu, và những lần thử nghiệm chúng ta gật đầu đồng ý một tỷ lệ sai trái là p, thì Tỷ Lệ gồm tối thiểu 1 sai lạc vào n lần phân tích chính là

*
. khi n = 10 với p=0.05 thì xác suất bao gồm ít nhất một sai lầm lên đến: 40%.

“Bài học” đúc rút từ bỏ biện pháp lí giải trên là nhỏng sau: nếu như bọn họ đọc một bài báo công nghệ nhưng mà trong đó bên nghiên cứu và phân tích thực hiện nhiều phân tích khác nhau cùng với các công dụng trị số p

Đối với một fan làm nghiên cứu và phân tích, ý nghĩa sâu sắc của vấn đề thể nghiệm nhiều đưa tngày tiết là: tránh việc “câu cá”. Xin nói thêm về tư tưởng “câu cá” trong kỹ thuật. Hãy tưởng tượng, một đơn vị nghiên cứu và phân tích ước ao mày mò kết quả của một thuật khám chữa new cho các bệnh nhân đau khớp. Sau khi xem xét những nghiên cứu đã ra mắt trong y văn uống, đơn vị nghiên cứu và phân tích ra quyết định thực hiện một nghiên cứu và phân tích bên trên 300 bệnh nhân: phân nửa được khám chữa bằng thuật bắt đầu, phân nửa chỉ thực hiện trả dược. Sau thời hạn quan sát và theo dõi, tích lũy dữ liệu, bên nghiên cứu và phân tích đối chiếu cùng phát hiện tại sự khác hoàn toàn thân nhì team không tồn tại ý nghĩa sâu sắc những thống kê. Nói giải pháp khác, thuật khám chữa không có hiệu quả. Nhà phân tích ko Chịu “đầu hàng”, cần tìm mang lại được một kết quả tất cả chân thành và ý nghĩa thống kê: phân chia người bệnh thành các đội theo độ tuổi (trên 50 hay bên dưới 50), theo giới tính (phái nam hay nữa), nguyên tố kinh tế tài chính (gồm thu nhập cao tốt thấp), cùng kinh nghiệm (chơi thể thao tuyệt không). Tính tầm thường, bên nghiên cứu và phân tích bao gồm 16 nhóm khác nhau, cùng hoàn toàn có thể thử nghiệm 16 lần. Nhà nghiên cứu “đi khám phá” thuật khám chữa có ý nghĩa thống kê vào nhóm thiếu phụ tuổi trên 50 với bao gồm các khoản thu nhập cao. Và, kết quả bên trên được chào làng. Đó là một trong công đoạn thao tác làm việc cơ mà giới nghiên cứu và phân tích kỹ thuật Call là “fishing expedition” (một chuyến du ngoạn câu cá). Tất nhiên, một hiệu quả như thế không có quý giá khoa học và cần thiết tin được. (Với 16 nghiên cứu khác biệt cùng cùng với p = 0.05, Xác Suất mà lại một phân tích gồm tác dụng “significant” lên đến 55%, do đó họ chẳng kinh ngạc trong khi thấy có một “bé cá” được bắt!)

Để cho công dụng trị số P tất cả chân thành và ý nghĩa ngulặng thủy của nó vào bối cảnh phân tách nhiều đưa tngày tiết, những công ty nghiên cứu và phân tích ý kiến đề xuất sử dụng thuật điều chỉnh Bonferroni (tên của một công ty thống kê lại học tập người Ý từng đề xuất cách có tác dụng này). Theo kiến nghị này, trước khi thực hiện nghiên cứu và phân tích, nhà phân tích nên xác minh rõ đưa thuyết nào là chính, cùng mang ttiết làm sao là phụ. Hình như, đơn vị nghiên cứu và phân tích còn yêu cầu đề ra chiến lược đang nghiên cứu từng nào mang ttiết trước khi bắt tay vào so sánh dữ liệu. Chẳng hạn như nếu bên nghiên cứu có kế hoạch phân tách trăng tròn đối chiếu với mong muốn duy trì mang đến trị số p sống 0.05, thì nuốm vị nhờ vào 0.05 là tiêu chuẩn để tuyên bố“significant”, bên nghiên cứu buộc phải nhờ vào tiêu chuẩn 0.0025 (tức mang 0.05 chia cho 20) để tulặng bố “significant”. Nói biện pháp khác, chỉ khi nào một hiệu quả tất cả trị số p thấp rộng 0.0025 (giỏi nói phổ biến là p/n) thì công ty nghiên cứu và phân tích new tất cả “quyền” tuim tía hiệu quả đó gồm ý nghĩa những thống kê.

Trị số P, mặc dù cực kỳ phổ biến vào nghiên cứu và phân tích kỹ thuật, chưa hẳn là 1 trong những phán xét sau cùng của một công trình nghiên cứu và phân tích hay một giả tmáu. Nhưng trong thực tế, những công ty công nghệ đang vượt chịu ảnh hưởng vào trị số P. để tư duy trong nghiên cứu và tulặng ba phần đông khám phá cơ mà sau đây được chứng minh là sai lạc. cũng có thể bảo rằng bởi vì sự sử dụng quá với dựa vào một cách mù quáng vào trị số Phường cơ mà khoa học, nhất là y sinc học tập, sẽ trsống đề nghị bần cùng. Hàng ngày họ hiểu tuyệt nghe các phát hiện tại khoa học trái ngược nhau (như dịp thì gồm nghiên cứu cho biết cà phê có chức năng xuất sắc đến sức khỏe, thời điểm khác bao gồm phân tích cho thấy thêm coffe có hại mang lại sức khỏe; tuyệt dịp thì thuốc bớt đau aspirin bao gồm tính năng làm giảm nguy cơ tiềm ẩn ung thư, tuy thế mới đây tất cả nghiên cứu cho biết aspirin hoàn toàn có thể có tác dụng tăng nguy cơ tiềm ẩn bị ung thỏng vú, v.v…). Có khi công bọn chúng trù trừ phát hiện tại làm sao là thực cùng vạc hiện tại làm sao là “dương tính giả”. Theo so sánh của Berger cùng Sellke, khoảng tầm 25% các phát hiện với “p

Do kia, bọn họ không nên quá phụ thuộc vào vào trị số P. Không buộc phải cđọng phân tích làm sao với p0.05 là thua cuộc. Có lúc 1 phân phát hiện nay cùng với p>0.05 tuy vậy lại là một trong phân phát hiện nay gồm chân thành và ý nghĩa. Vấn đề đặc biệt là làm sao nhằm dự trù mức độ khả dĩ của một mang thuyết một lúc bao gồm dữ khiếu nại thiệt vào tay, có nghĩa là dự trù P(H+ | D). Để ước tính P(H+ | D), chúng ta cần áp dụng định lí Bayes, cùng cách tiếp cận định lí này sẽ không nằm trong phạm trù của cuốn sách này. quý khách hiểu ước ao tham khảo thêm có thể hiểu một vài bài báo của người sáng tác tuyệt những các bài báo của James Berger mà tư liệu tham khảo sau đây rất có thể hỗ trợ thêm.

Tài liệu tham khảo:

<1> Wulff et al., Statistics in Medicine 1987; 6:3-10.

<2> Berger JO, Sellke T. Testing a point null hypothesis: the irreconcilability of P-values và evidence. Journal of the American Statistical Association 1987; 82:112-20