← all shorts

Psychology

Dunning-Kruger Effect

#099 · 5 min read

A young person stands with arms raised against a backdrop of a mountain labeled "Mount Stupid," symbolizing the Dunning-Kruger effect.

In 1995, a man robbed two Pittsburgh banks with lemon juice on his face, believing it would make him invisible to cameras. A Cornell psychologist read about the case, could not let it go, and turned it into one of the most cited papers in modern psychology.

In April 1995, a man named McArthur Wheeler walked into two Pittsburgh banks in the middle of the day, no mask, no disguise. He had smeared lemon juice on his face. Lemon juice, he reasoned, was used as invisible ink — so a face coated in it would not show up on the security cameras. The cameras showed him clearly. He was arrested within hours. When the detectives played him the tape, he stared at it and said: "But I wore the juice."

The story made it into the 1996 World Almanac, where a Cornell psychologist named David Dunning read it. Dunning could not stop thinking about it. Wheeler was not delusional in the clinical sense and was not drunk. He had a theory of the world, had tested it crudely (he reported that a Polaroid taken with juice on his face came out blank, possibly because he had pointed the camera at the ceiling), and had acted on it with total confidence. What he lacked was the metacognitive equipment to notice his theory was wrong.

Dunning-kruger effect - percentile
Dunning-kruger effect - percentile Phlsph7 · BY-SA 4.0

With his graduate student Justin Kruger, Dunning designed an experiment. They gave Cornell undergraduates tests in three domains — logical reasoning, English grammar, and humor judged against a panel of professional comedians — and asked each student to estimate how well they had done relative to peers. The 1999 paper that followed, Unskilled and Unaware of It, is one of the most cited and most misread papers in modern psychology.

The cruel symmetry

The finding was specific and strange. Students in the bottom quartile, who answered fewer than four in ten questions correctly, believed on average that they had scored in the 62nd percentile. The top quartile, who actually landed around the 86th percentile, estimated they had reached the 70th. The worst overestimated. The best underestimated. The middle, more or less, knew where they stood.

A psychology experiment room shows participants completing a skills test at separate desks
A psychology experiment room shows participants completing a skills test at separate desks Illustration · AI-generated (FLUX.1-dev)

Dunning and Kruger's argument was not that incompetent people are arrogant. It was something more uncomfortable: the skills you need to do a task are the same skills you need to evaluate whether you have done it well. A novice driver has no internal yardstick for what good driving looks like, so anything that gets them home counts as success. A bad writer cannot reliably tell a good sentence from a bad one. Competence and self-assessment are not two separate faculties that happen to track each other; they are, in large part, the same faculty.

Dunning–Kruger Effect 01
Dunning–Kruger Effect 01 忍者猫 · CC0 1.0

The mirror image is just as important. Strong performers underestimated themselves because they assumed the task was easy for everyone. Expertise makes the problem look smaller. Ignorance makes it disappear.

A driving lesson on a sunny suburban street captures early overconfidence physically: a ne
A driving lesson on a sunny suburban street captures early overconfidence physically: a ne Illustration · AI-generated (FLUX.1-dev)

The statistical complaint

In the years since, the effect has acquired a life of its own — a tidy graph with a "Peak of Mount Stupid" and a "Valley of Despair" that gets passed around on management blogs and never appeared in the original paper. The chart is invented. The valley is folklore.

Dunning-kruger effect - simulation1
Dunning-kruger effect - simulation1 Phlsph7 · BY-SA 4.0

The original effect has also been challenged on statistical grounds. In 2017, Ed Nuhfer and colleagues argued that much of what Dunning and Kruger saw was a regression to the mean artefact: if you sort people by performance and then ask each to estimate their rank, the bottom group can only err upward and the top group can only err downward. A random-noise generator produces the same shape. Gilles Gignac and Marcin Zajenkowski reached similar conclusions in 2020, replicating the curve with simulated data that contained no Dunning-Kruger effect at all.

Dunning has responded that the pattern survives controls for regression, and that the effect appears most strongly when people are given a chance to revise their estimates after seeing peer performance and still cling to their original confidence. The phenomenon is probably real, but smaller and less universal than the cartoon version implies.

A library study room shows the opposite side of competence: an expert surrounded by practi
A library study room shows the opposite side of competence: an expert surrounded by practi Illustration · AI-generated (FLUX.1-dev)

What we still don't know

We do not know how domain-general the effect is. The original study used Cornell undergraduates on academic tasks. Replications in chess, medicine, and firearms safety show the pattern in some domains and not others, and studies in East Asian samples have sometimes found the opposite shape — underconfidence at the low end, possibly tied to different cultural norms around self-presentation.

Dunning-Kruger Effect
Dunning-Kruger Effect https://commons.wikimedia.org/w/index.php?title=User:Diego_M · CC BY-SA 4.0

We do not know whether it is fixable. Brief feedback rarely shifts bottom-quartile estimates by much. Longer training improves both skill and self-assessment together, which fits the original theory but offers no lever to pull on someone else's overconfidence from the outside.

A group feedback session shows participants comparing their performance after seeing anony
A group feedback session shows participants comparing their performance after seeing anony Illustration · AI-generated (FLUX.1-dev)

And we do not know what to do about it socially. The uncomfortable corollary is that the people most certain in any room are disproportionately likely to be the people who understand the topic least, and the people best equipped to correct them are disproportionately likely to hedge. Meetings, elections, and hiring committees are not designed to weight for this.

McArthur Wheeler served his sentence and went back to a quiet life. Asked, years later, whether he understood now what had gone wrong with the lemon juice, he reportedly said he still did not see why the cameras had picked him up. The juice, he maintained, had been fresh.

1995年,一名男子在脸上涂抹柠檬汁抢劫了匹兹堡的两家银行,他相信这能让自己在摄像机前隐身。康奈尔大学的一位心理学家读到了这个案例,无法释怀,并将其写成了现代心理学中引用率最高的论文之一。

1995年4月,一个名叫 McArthur Wheeler 的男子在光天化日之下走进匹兹堡的两家银行,没有戴面具,也没有伪装。他在脸上涂了柠檬汁。他推断,柠檬汁被用作隐形墨水——所以涂了柠檬汁的脸不会出现在安全摄像机上。摄像机清晰地拍下了他。他在几小时内被捕。当侦探们给他播放录像带时,他盯着录像带说:“但我涂了汁啊。”

这个故事进入了1996年的《世界年鉴》,康奈尔大学一位名叫 David Dunning 的心理学家读到了它。邓宁无法停止思考这件事。惠勒从临床角度来看并没有妄想症,也没有喝醉。他有一套世界理论,粗糙地测试过它(他报告说涂了汁在脸上拍的宝丽来照片是空白的,可能是因为他把相机对准了天花板),并怀着绝对的信心付诸行动。他所缺乏的是注意到自己的理论是错误的元认知能力。

Dunning-kruger effect - percentile
Dunning-kruger effect - percentile Phlsph7 · BY-SA 4.0

与他的研究生 Justin Kruger 一起,邓宁设计了一个实验。他们让康奈尔大学的本科生在三个领域进行测试——逻辑推理、英语语法以及由专业喜剧演员评判的幽默感——并要求每个学生估计自己相对于同龄人的表现。随后在1999年发表的论文 Unskilled and Unaware of It 是现代心理学中引用最多也最常被误读的论文之一。

残酷的对称性

研究结果具体而奇特。处于底部四分之一的同学,他们答对的题不足十分之四,却平均认为自己得分在第62百分位数。而实际上处于第86百分位数左右的顶部四分之一的同学,估计自己达到了第70百分位数。最差的高估了自己。最好的低估了自己。中间的人或多或少知道自己的位置。

A psychology experiment room shows participants completing a skills test at separate desks
A psychology experiment room shows participants completing a skills test at separate desks Illustration · AI-generated (FLUX.1-dev)

邓宁和克鲁格的论点并不是说无能的人傲慢。而是更令人不安的事实:做一项任务所需的技能,与评估自己是否做好该任务所需的技能是相同的。新手司机没有评估什么是好驾驶的内部标准,所以任何能把他们带回家的驾驶都算作成功。糟糕的作家无法可靠地分清好句子和坏句子。能力和自我评估不是两个碰巧相互追踪的独立能力;在很大程度上,它们是同一种能力。

Dunning–Kruger Effect 01
Dunning–Kruger Effect 01 忍者猫 · CC0 1.0

镜中之像也同样重要。表现优异的人低估了自己,因为他们认为这项任务对每个人都很容易。专业知识让问题看起来变小了。无知则让问题消失。

A driving lesson on a sunny suburban street captures early overconfidence physically: a ne
A driving lesson on a sunny suburban street captures early overconfidence physically: a ne Illustration · AI-generated (FLUX.1-dev)

统计学上的质疑

在此后的几年里,这种效应有了自己的生命——一张画着“愚蠢之山巅峰”和“绝望之谷”的整洁图表,在管理博客上广为流传,但从未出现在原始论文中。该图表是虚构的。山谷也是民间传说。

Dunning-kruger effect - simulation1
Dunning-kruger effect - simulation1 Phlsph7 · BY-SA 4.0

原始效应也受到了统计学上的挑战。2017年, Ed Nuhfer 及其同事提出,邓宁和克鲁格所看到的大部分现象都是 regression to the mean(向均值回归)的人为产物:如果你按表现对人进行排序,然后要求每个人估计自己的排名,底部群体只能往高了错,顶部群体只能往低了错。随机噪声生成器也能产生相同的形状。 Gilles Gignac 和 Marcin Zajenkowski 在2020年得出了类似的结论,他们用完全不包含邓宁-克鲁格效应的模拟数据复制了这条曲线。

邓宁对此回应说,在控制了回归因素后,该模式依然存在,而且当人们在看到同行表现后有机会修改其估计却仍然坚守最初的信心时,这种效应表现得最为强烈。这一现象可能是真实的,但比卡通版本所暗示的要小,也没有那么普遍。

A library study room shows the opposite side of competence: an expert surrounded by practi
A library study room shows the opposite side of competence: an expert surrounded by practi Illustration · AI-generated (FLUX.1-dev)

我们仍未知道的事

我们不知道这种效应在多大程度上是跨领域的。最初的研究使用的是康奈尔大学本科生的学术任务。在国际象棋、医学和枪支安全方面的复制研究表明,该模式在某些领域存在,而在其他领域不存在,且在东亚样本中的研究有时会发现相反的形状——低水平者的信心不足,这可能与围绕自我呈现的不同文化规范有关。

Dunning-Kruger Effect
Dunning-Kruger Effect https://commons.wikimedia.org/w/index.php?title=User:Diego_M · CC BY-SA 4.0

我们不知道它是否可以被修复。简短的反馈很少能大幅改变底部四分之一人群的估计。更长时间的培训能同时提高技能和自我评估,这符合原始理论,但没有提供从外部撬动他人过度自信的杠杆。

A group feedback session shows participants comparing their performance after seeing anony
A group feedback session shows participants comparing their performance after seeing anony Illustration · AI-generated (FLUX.1-dev)

我们也不知道在社会层面上该如何应对它。令人不安的推论是,在任何房间里最确定的人,其理解该主题最少的可能性高得不成比例;而最能纠正他们的人,则最有可能采取保留态度。会议、选举和招聘委员会的设计并没有考虑权衡这一点。

麦克アーサー·惠勒服完刑后回到了平静的生活。多年后被问及他现在是否明白柠檬汁出了什么问题时,据报道他表示,他仍然不明白为什么摄像机拍下了他。他坚持认为,柠檬汁一直是新鲜的。

En 1995, un hombre robó dos bancos de Pittsburgh con zumo de limón en la cara, creyendo que lo haría invisible a las cámaras. Un psicólogo de Cornell leyó sobre el caso, no pudo olvidarlo y lo convirtió en uno de los artículos más citados de la psicología moderna.

En abril de 1995, un hombre llamado McArthur Wheeler entró en dos bancos de Pittsburgh en pleno día, sin máscara ni disfraz. Se había untado zumo de limón en la cara. El zumo de limón, razonaba, se usaba como tinta invisible, por lo que una cara cubierta con él no aparecería en las cámaras de seguridad. Las cámaras lo mostraron con total claridad. Fue arrestado a las pocas horas. Cuando los detectives le mostraron la cinta, la miró fijamente y dijo: «Pero si me puse el zumo».

La historia llegó al World Almanac de 1996, donde la leyó un psicólogo de Cornell llamado David Dunning. Dunning no podía dejar de pensar en ello. Wheeler no sufría delirios en el sentido clínico ni estaba borracho. Tenía una teoría del mundo, la había probado rudimentariamente (declaró que una foto Polaroid tomada con zumo en la cara salió en blanco, posiblemente porque había apuntado la cámara al techo) y había actuado en base a ella con total confianza. Lo que le faltaba era el equipo metacognitivo para notar que su teoría era errónea.

Dunning-kruger effect - percentile
Dunning-kruger effect - percentile Phlsph7 · BY-SA 4.0

Junto con su estudiante de posgrado Justin Kruger, Dunning diseñó un experimento. Dieron a estudiantes de pregrado de Cornell pruebas en tres áreas (razonamiento lógico, gramática inglesa y humor juzgado por un panel de comediantes profesionales) y pidieron a cada estudiante que estimara qué tan bien lo había hecho en relación con sus compañeros. El artículo resultante de 1999, Unskilled and Unaware of It, es uno de los más citados y más malinterpretados en la psicología moderna.

La cruel simetría

El hallazgo fue específico y extraño. Los estudiantes en el cuartil inferior, que respondieron correctamente a menos de cuatro de cada diez preguntas, creían en promedio que habían puntuado en el percentil 62. El cuartil superior, que en realidad se ubicó alrededor del percentil 86, estimó que había alcanzado el percentil 70. Los peores se sobreestimaron. Los mejores se subestimaron. Los del medio, más o menos, sabían dónde estaban.

A psychology experiment room shows participants completing a skills test at separate desks
A psychology experiment room shows participants completing a skills test at separate desks Illustration · AI-generated (FLUX.1-dev)

El argumento de Dunning y Kruger no era que las personas incompetentes sean arrogantes. Era algo más incómodo: las habilidades que necesitas para hacer una tarea son las mismas habilidades que necesitas para evaluar si la has hecho bien. Un conductor novato no tiene un criterio interno de cómo es conducir bien, por lo que cualquier cosa que lo lleve a casa cuenta como éxito. Un mal escritor no puede distinguir de manera confiable una buena oración de una mala. La competencia y la autoevaluación no son dos facultades separadas que casualmente se rastrean; son, en gran parte, la misma facultad.

Dunning–Kruger Effect 01
Dunning–Kruger Effect 01 忍者猫 · CC0 1.0

La imagen especular es igual de importante. Los de alto desempeño se subestimaron a sí mismos porque asumieron que la tarea era fácil para todos. La experiencia hace que el problema parezca más pequeño. La ignorancia lo hace desaparecer.

A driving lesson on a sunny suburban street captures early overconfidence physically: a ne
A driving lesson on a sunny suburban street captures early overconfidence physically: a ne Illustration · AI-generated (FLUX.1-dev)

La queja estadística

En los años transcurridos, el efecto ha adquirido vida propia: un gráfico ordenado con un «Pico del Monte de la Estupidez» y un «Valle de la Desesperación» que se comparte en blogs de gestión y que nunca apareció en el artículo original. El gráfico es inventado. El valle es folclore.

Dunning-kruger effect - simulation1
Dunning-kruger effect - simulation1 Phlsph7 · BY-SA 4.0

El efecto original también ha sido cuestionado por motivos estadísticos. En 2017, Ed Nuhfer y sus colegas argumentaron que gran parte de lo que Dunning y Kruger vieron era un artefacto de la regression to the mean (regresión a la media): si clasificas a las personas por su desempeño y luego pides a cada una que estime su rango, el grupo inferior solo puede errar hacia arriba y el grupo superior solo puede errar hacia abajo. Un generador de ruido aleatorio produce la misma forma. Gilles Gignac y Marcin Zajenkowski llegaron a conclusiones similares en 2020, replicando la curva con datos simulados que no contenían ningún efecto Dunning-Kruger.

Dunning ha respondido que el patrón sobrevive a los controles de regresión, y que el efecto aparece con mayor fuerza cuando a las personas se les da la oportunidad de revisar sus estimaciones después de ver el desempeño de sus compañeros y aún así se aferran a su confianza original. El fenómeno es probablemente real, pero más pequeño y menos universal de lo que implica la versión de caricatura.

A library study room shows the opposite side of competence: an expert surrounded by practi
A library study room shows the opposite side of competence: an expert surrounded by practi Illustration · AI-generated (FLUX.1-dev)

Lo que aún no sabemos

No sabemos qué tan general de dominio es el efecto. El estudio original utilizó estudiantes de Cornell en tareas académicas. Las réplicas en ajedrez, medicina y seguridad de armas de fuego muestran el patrón en algunos campos y no en otros, y los estudios en muestras del este asiático a veces han encontrado la forma opuesta: falta de confianza en el extremo inferior, posiblemente vinculada a diferentes normas culturales sobre la autopresentación.

Dunning-Kruger Effect
Dunning-Kruger Effect https://commons.wikimedia.org/w/index.php?title=User:Diego_M · CC BY-SA 4.0

No sabemos si es solucionable. La retroalimentación breve rara vez altera mucho las estimaciones del cuartil inferior. Un entrenamiento más prolongado mejora tanto la habilidad como la autoevaluación juntas, lo que encaja con la teoría original, pero no ofrece ninguna palanca para influir desde fuera en la exceso de confianza de otra persona.

A group feedback session shows participants comparing their performance after seeing anony
A group feedback session shows participants comparing their performance after seeing anony Illustration · AI-generated (FLUX.1-dev)

Y no sabemos qué hacer al respecto socialmente. El incómodo corolario es que las personas más seguras en cualquier sala son desproporcionadamente propensas a ser las que menos entienden del tema, y las mejor equipadas para corregirlas son desproporcionadamente propensas a dudar. Las reuniones, las elecciones y los comités de contratación no están diseñados para ponderar esto.

McArthur Wheeler cumplió su condena y volvió a una vida tranquila. Al preguntarle, años más tarde, si entendía ahora qué había salido mal con el zumo de limón, según se informa dijo que todavía no veía por qué las cámaras lo habían captado. El zumo, sostuvo, había sido fresco.

في عام 1995، سرق رجل بنكين في بيتسبرغ واضعًا عصير الليمون على وجهه، معتقدًا أنه سيجعله غير مرئي للكاميرات. قرأ عالم نفس في جامعة كورنيل عن القضية، ولم يتمكن من تجاوزها، وحولها إلى واحدة من أكثر الأوراق البحثية استشهادًا بها في علم النفس الحديث.

في أبريل 1995، مشى رجل يُدعى McArthur Wheeler إلى بنكين في بيتسبرغ في منتصف النهار، بلا قناع وبلا تنكر. كان قد لطخ وجهه بعصير الليمون. وافترض أن عصير الليمون يُستخدم كحبر سري — لذا فإن الوجه المغطى به لن يظهر على كاميرات المراقبة. أظهرته الكاميرات بوضوح شديد. تم القبض عليه في غضون ساعات. عندما عرض عليه المحققون الشريط، حدق فيه وقال: "لكنني وضعت العصير".

وصلت القصة إلى كتاب حقائق العالم لعام 1996، حيث قرأها عالم نفس في جامعة كورنيل يُدعى David Dunning. لم يستطع دنينغ التوقف عن التفكير في الأمر. لم يكن ويلر واهمًا بالمعنى السريري ولم يكن مخمورًا. كانت لديه نظرية عن العالم، واختبرها بشكل بدائي (أفاد بأن صورة بولارويد التُقطت مع العصير على وجهه ظهرت فارغة، ربما لأنه وجه الكاميرا نحو السقف)، وتصرف بناءً عليها بثقة مطلقة. ما كان ينقصه هو العتاد الميتا معرفي لملاحظة أن نظريته كانت خاطئة.

Dunning-kruger effect - percentile
Dunning-kruger effect - percentile Phlsph7 · BY-SA 4.0

صمم دنينغ تجربة مع طالبه الخريج Justin Kruger. وأعطوا طلاب كورنيل الجامعيين اختبارات في ثلاثة مجالات — التفكير المنطقي، وقواعد اللغة الإنجليزية، والفكاهة المحكومة مقارنة بلجنة من الكوميديين المحترفين — وطلبوا من كل طالب تقدير مدى حسن أدائه مقارنة بأقرانه. الورقة البحثية لعام 1999 التي تلت ذلك، Unskilled and Unaware of It، هي واحدة من أكثر الأوراق استشهادًا بها وأكثرها إساءة للفهم في علم النفس الحديث.

التناظر القاسي

كانت النتيجة محددة وغريبة. فالطلاب في الربع السفلي، الذين أجابوا بشكل صحيح على أقل من أربعة من أصل عشرة أسئلة، اعتقدوا في المتوسط أنهم سجلوا في المئين 62. في حين أن الربع العلوي، الذين حلوا في الواقع حول المئين 86، قدروا أنهم وصلوا إلى المئين 70. الأسوأ قدروا أنفسهم بأعلى من حقيقتهم. والأفضل قدروا أنفسهم بأقل من حقيقتهم. أما أصحاب الوسط، فكانوا يعرفون مكانهم تقريبًا.

A psychology experiment room shows participants completing a skills test at separate desks
A psychology experiment room shows participants completing a skills test at separate desks Illustration · AI-generated (FLUX.1-dev)

لم تكن حجة دنينغ وكروجر هي أن الأشخاص غير الأكفاء مغرورون. بل كان الأمر أكثر إزعاجًا: المهارات التي تحتاجها للقيام بمهمة هي نفس المهارات التي تحتاجها لتقييم ما إذا كنت قد قمت بها بشكل جيد. السائق المبتدئ ليس لديه مقياس داخلي لما يبدو عليه القيادة الجيدة، لذا فإن أي شيء يعيده إلى المنزل يعتبر نجاحًا. الكاتب السيئ لا يمكنه التمييز بشكل موثوق بين الجملة الجيدة والسيئة. الكفاءة والتقييم الذاتي ليسا ملكتين منفصلتين تصادف أنهما تتتبعان بعضهما البعض؛ بل هما، في جزء كبير منهما، نفس الملكة.

Dunning–Kruger Effect 01
Dunning–Kruger Effect 01 忍者猫 · CC0 1.0

والصورة المرآتية لا تقل أهمية. فالمؤدون الأقوياء قدروا أنفسهم بأقل من حقيقتها لأنهم افترضوا أن المهمة كانت سهلة للجميع. الخبرة تجعل المشكلة تبدو أصغر. والجهل يجعلها تختفي.

A driving lesson on a sunny suburban street captures early overconfidence physically: a ne
A driving lesson on a sunny suburban street captures early overconfidence physically: a ne Illustration · AI-generated (FLUX.1-dev)

الشكوى الإحصائية

في السنوات التي تلت ذلك، اكتسب التأثير حياة خاصة به — رسم بياني مرتب مع "قمة جبل الغباء" و"وادي اليأس" يتم تناقله في مدونات الإدارة ولم يظهر قط في الورقة البحثية الأصلية. المخطط مخترع، والوادي من الفولكلور.

Dunning-kruger effect - simulation1
Dunning-kruger effect - simulation1 Phlsph7 · BY-SA 4.0

كما تم التشكيك في التأثير الأصلي على أسس إحصائية. ففي عام 2017، جادل Ed Nuhfer وزملاؤه بأن الكثير مما رآه دنينغ وكروجر كان نتاج ظاهرة regression to the mean (الرجوع إلى المتوسط): فإذا قمت بفرز الأشخاص حسب الأداء ثم طلبت من كل منهم تقدير رتبته، فإن المجموعة السفلية يمكنها فقط الخطأ إلى الأعلى والمجموعة العلوية يمكنها فقط الخطأ إلى الأسفل. ومولد الضوضاء العشوائية ينتج نفس الشكل. وتوصل Gilles Gignac ومارسين زاجينكوفسكي إلى استنتاجات مماثلة في عام 2020، حيث قاما بتكرار المنحنى ببيانات محاكاة لا تحتوي على تأثير دنينغ-كروجر على الإطلاق.

وقد رد دنينغ بأن النمط ينجو من ضوابط التراجع، وأن التأثير يظهر بقوة أكبر عندما يُمنح الناس فرصة لمراجعة تقديراتهم بعد رؤية أداء الأقران ولا يزالون يتشبثون بثقتهم الأصلية. الظاهرة ربما تكون حقيقية، لكنها أصغر وأقل عالمية مما توحي به النسخة الكاريكاتورية.

A library study room shows the opposite side of competence: an expert surrounded by practi
A library study room shows the opposite side of competence: an expert surrounded by practi Illustration · AI-generated (FLUX.1-dev)

ما لا نزال لا نعرفه

نحن لا نعرف مدى عمومية التأثير على المجالات المختلفة. استخدمت الدراسة الأصلية طلاب كورنيل في المهام الأكاديمية. وتظهر عمليات التكرار في الشطرنج، والطب، والسلامة من الأسلحة النارية النمط في بعض المجالات دون غيرها، ووجدت الدراسات في العينات الآسيوية الشرقية أحيانًا الشكل المعاكس — قلة الثقة في النهاية المنخفضة، ربما لارتباطها بمعايير ثقافية مختلفة حول تقديم الذات.

Dunning-Kruger Effect
Dunning-Kruger Effect https://commons.wikimedia.org/w/index.php?title=User:Diego_M · CC BY-SA 4.0

نحن لا نعرف ما إذا كان قابلاً للإصلاح. نادرًا ما تؤدي التغذية الراجعة الموجزة إلى تغيير تقديرات الربع السفلي بشكل كبير. بينما يعمل التدريب الأطول على تحسين المهارة والتقييم الذاتي معًا، وهو ما يتوافق مع النظرية الأصلية ولكنه لا يوفر أي رافعة للتأثير على ثقة شخص آخر المفرطة من الخارج.

A group feedback session shows participants comparing their performance after seeing anony
A group feedback session shows participants comparing their performance after seeing anony Illustration · AI-generated (FLUX.1-dev)

ونحن لا نعرف ماذا نفعل حيال ذلك اجتماعيًا. والنتيجة المزعجة هي أن الأشخاص الأكثر يقينًا في أي غرفة هم على الأرجح الأشخاص الأقل فهمًا للموضوع بنسبة غير متناسبة، والأشخاص الأكثر تأهيلاً لتصحيحهم هم الأكثر عرضة للتحوط بنسبة غير متناسبة. الاجتماعات، والانتخابات، ولجان التوظيف لم تُصمم لترجيح هذا الأمر.

قضى مكارتور ويلر عقوبته وعاد إلى حياة هادئة. وعندما سُئل بعد سنوات عما إذا كان يفهم الآن ما الذي حدث من خطأ في عصير الليمون، ورد أنه قال إنه لا يزال لا يرى سبب التقاط الكاميرات له. وأصر على أن العصير كان طازجًا.

Em 1995, un homem roubou dois bancos em Pittsburgh com suco de limão no rosto, acreditando que isso o tornaria invisível para as câmeras. Um psicólogo de Cornell leu sobre o caso, não conseguiu esquecê-lo e o transformou em um dos artigos mais citados da psicologia moderna.

Em abril de 1995, um homem chamado McArthur Wheeler entrou em dois bancos de Pittsburgh em pleno dia, sem máscara e sem disfarce. Ele havia espalhado suco de limão no rosto. O suco de limão, raciocinou ele, era usado como tinta invisível — então um rosto coberto com ele não apareceria nas câmeras de segurança. As câmeras o mostraram claramente. Ele foi preso em poucas horas. Quando os detetives lhe mostraram a gravação, ele olhou fixamente e disse: "Mas eu usei o suco".

A história chegou ao World Almanac de 1996, onde um psicólogo de Cornell chamado David Dunning a leu. Dunning não conseguia parar de pensar nisso. Wheeler não era delirante no sentido clínico e não estava bêbado. Ele tinha uma teoria do mundo, a havia testado rudimentarmente (ele relatou que uma foto Polaroid tirada com suco no rosto saiu em branco, possivelmente porque ele havia apontado a câmera para o teto) e agira com total confiança. O que lhe faltava era o aparato metacognitivo para perceber que sua teoria estava errada.

Dunning-kruger effect - percentile
Dunning-kruger effect - percentile Phlsph7 · BY-SA 4.0

Com seu estudante de pós-graduação Justin Kruger, Dunning desenhou um experimento. Eles aplicaram testes em estudantes de graduação de Cornell em três domínios — raciocínio lógico, gramática inglesa e humor julgado por um painel de comediantes profissionais — e pediram a cada estudante que estimasse seu desempenho em relação aos pares. O artigo de 1999 que se seguiu, Unskilled and Unaware of It, é um dos artigos mais citados e mais mal interpretados da psicologia moderna.

A simetria cruel

A descoberta foi específica e estranha. Os estudantes no quartil inferior, que responderam corretamente a menos de quatro em cada dez perguntas, acreditavam em média que haviam pontuado no percentil 62. O quartil superior, que na verdade ficou em torno do percentil 86, estimou ter atingido o percentil 70. Os piores se superestimaram. Os melhores se subestimaram. O meio, mais ou menos, sabia onde estava.

A psychology experiment room shows participants completing a skills test at separate desks
A psychology experiment room shows participants completing a skills test at separate desks Illustration · AI-generated (FLUX.1-dev)

O argumento de Dunning e Kruger não era de que pessoas incompetentes são arrogantes. Era algo mais desconfortável: as habilidades de que você precisa para realizar uma tarefa são as mesmas de que precisa para avaliar se a fez bem. Um motorista novato não tem um critério interno do que é dirigir bem, então qualquer coisa que o leve para casa conta como sucesso. Um escritor ruim não consegue distinguir com segurança uma frase boa de uma ruim. Competência e autoavaliação não são duas faculdades separadas que por acaso se acompanham; são, em grande parte, a mesma faculdade.

Dunning–Kruger Effect 01
Dunning–Kruger Effect 01 忍者猫 · CC0 1.0

A imagem espelhada é igualmente importante. Os de alto desempenho se subestimaram porque presumiram que a tarefa era fácil para todos. A especialização faz o problema parecer menor. A ignorância o faz desaparecer.

A driving lesson on a sunny suburban street captures early overconfidence physically: a ne
A driving lesson on a sunny suburban street captures early overconfidence physically: a ne Illustration · AI-generated (FLUX.1-dev)

A reclamação estatística

Nos anos seguintes, o efeito adquiriu vida própria — um gráfico arrumado com um "Pico do Monte da Estupidez" e um "Vale do Desespero" que circula em blogs de gestão e que nunca apareceu no artigo original. O gráfico é inventado. O vale é folclore.

Dunning-kruger effect - simulation1
Dunning-kruger effect - simulation1 Phlsph7 · BY-SA 4.0

O efeito original também foi contestado em termos estatísticos. Em 2017, Ed Nuhfer e colegas argumentaram que muito do que Dunning e Kruger viram era um artefato de regression to the mean (regressão à média): se você classificar as pessoas por desempenho e depois pedir a cada uma para estimar sua classificação, o grupo inferior só pode errar para cima e o grupo superior só pode errar para baixo. Um gerador de ruído aleatório produz la mesma forma. Gilles Gignac e Marcin Zajenkowski chegaram a conclusões semelhantes em 2020, replicando a curva com dados simulados que não continham nenhum efeito Dunning-Kruger.

Dunning respondeu que o padrão sobrevive aos controles de regressão, e que o efeito aparece com mais força quando as pessoas têm a oportunidade de revisar suas estimativas após ver o desempenho dos pares e ainda assim se aferram à confiança original. O fenômeno é provavelmente real, mas menor e menos universal do que a versão em caricatura sugere.

A library study room shows the opposite side of competence: an expert surrounded by practi
A library study room shows the opposite side of competence: an expert surrounded by practi Illustration · AI-generated (FLUX.1-dev)

O que ainda não sabemos

Não sabemos quão geral para domínios é o efeito. O estudo original usou graduandos de Cornell em tarefas acadêmicas. Replicações no xadrez, medicina e segurança de armas de fogo mostram o padrão em alguns domínios e não em outros, e estudos em amostras do Leste Asiático às vezes encontraram a forma oposta — subconfiança na faixa inferior, possivelmente ligada a diferentes normas culturais em torno da autoapresentação.

Dunning-Kruger Effect
Dunning-Kruger Effect https://commons.wikimedia.org/w/index.php?title=User:Diego_M · CC BY-SA 4.0

Não sabemos se é remediável. O feedback breve raramente altera muito as estimativas do quartil inferior. O treinamento mais longo melhora a habilidade e a autoavaliação conjuntamente, o que se ajusta à teoria original, mas não oferece nenhuma alavanca para influenciar a superconfiança de outra pessoa a partir de fora.

A group feedback session shows participants comparing their performance after seeing anony
A group feedback session shows participants comparing their performance after seeing anony Illustration · AI-generated (FLUX.1-dev)

E não sabemos o que fazer sobre isso socialmente. O corolário desconfortável é que as pessoas mais certas em qualquer sala têm uma probabilidade desproporcionalmente maior de ser as que menos compreendem o assunto, e as pessoas mais equipadas para corrigi-las têm uma probabilidade desproporcionalmente maior de vacilar. Reuniões, eleições e comitês de contratação não são projetados para ponderar isso.

McArthur Wheeler cumpriu sua pena e voltou a uma vida tranquila. Perguntado, anos depois, se entendia agora o que havia de errado com o suco de limão, ele supostamente disse que ainda não entendia por que as câmeras o haviam capturado. O suco, sustentou ele, estava fresco.

1995 में, एक व्यक्ति ने अपने चेहरे पर नींबू का रस लगाकर पिट्सबर्ग के दो बैंकों को लूटा, यह मानते हुए कि यह उसे कैमरों के लिए अदृश्य बना देगा। कॉर्नेल के एक मनोवैज्ञानिक ने इस मामले के बारे में पढ़ा, इसे जाने नहीं दे सके, और इसे आधुनिक मनोविज्ञान में सबसे अधिक उद्धृत शोध पत्रों में से एक में बदल दिया।

अप्रैल 1995 में, McArthur Wheeler नामक एक व्यक्ति बिना किसी मास्क या भेष के दिनदहाड़े पिट्सबर्ग के दो बैंकों में दाखिल हुआ। उसने अपने चेहरे पर नींबू का रस मला था। उसने तर्क दिया कि नींबू का रस अदृश्य स्याही के रूप में उपयोग किया जाता था—इसलिए इस रस से लेपित चेहरा सुरक्षा कैमरों में दिखाई नहीं देगा। कैमरों ने उसे स्पष्ट रूप से दिखाया। उसे कुछ ही घंटों में गिरफ्तार कर लिया गया। जब जासूसों ने उसे टेप दिखाया, तो उसने उसे घूरकर देखा और कहा: "लेकिन मैंने तो रस लगाया था।"

यह कहानी 1996 के वर्ल्ड अल्मनाक (विश्व पंचांग) में छपी, जहाँ कॉर्नेल के David Dunning नामक एक मनोवैज्ञानिक ने इसे पढ़ा। डनिंग इसके बारे में सोचना बंद नहीं कर सके। व्हीलर नैदानिक (क्लिनिकल) अर्थ में भ्रमित नहीं था और न ही नशे में था। उसके पास दुनिया का एक सिद्धांत था, उसने इसका कच्चा परीक्षण किया था (उसने बताया कि चेहरे पर रस लगाकर ली गई पोलरॉइड तस्वीर खाली आई थी, शायद इसलिए क्योंकि उसने कैमरे को छत की ओर घुमाया था), और उसने पूरे आत्मविश्वास के साथ इस पर काम किया था। उसके पास जिस चीज की कमी थी, वह यह नोटिस करने के लिए मेटाकॉग्निटिव उपकरण था कि उसका सिद्धांत गलत था।

Dunning-kruger effect - percentile
Dunning-kruger effect - percentile Phlsph7 · BY-SA 4.0

अपने स्नातक छात्र Justin Kruger के साथ, डनिंग ने एक प्रयोग डिजाइन किया। उन्होंने कॉर्नेल के स्नातक छात्रों को तीन क्षेत्रों—तार्किक तर्क, अंग्रेजी व्याकरण, और पेशेवर हास्य कलाकारों के पैनल के विरुद्ध आंके गए हास्य—में परीक्षण दिए और प्रत्येक छात्र से अनुमान लगाने को कहा कि उन्होंने साथियों की तुलना में कितना अच्छा प्रदर्शन किया है। इसके बाद 1999 का जो शोध पत्र आया, Unskilled and Unaware of It, वह आधुनिक मनोविज्ञान में सबसे अधिक उद्धृत और सबसे अधिक गलत समझा जाने वाला पेपर है।

क्रूर समरूपता

यह खोज विशिष्ट और अजीब थी। निचले चतुर्थक (बॉटम क्वार्टाइल) के छात्र, जिन्होंने दस में से चार से भी कम प्रश्नों के सही उत्तर दिए थे, उनका औसत मानना था कि उन्होंने 62वें पर्सेंटाइल में स्कोर किया था। शीर्ष चतुर्थक, जो वास्तव में 86वें पर्सेंटाइल के आसपास रहे, उन्होंने अनुमान लगाया कि वे 70वें स्थान पर पहुँचे हैं। सबसे खराब प्रदर्शन करने वालों ने खुद को बहुत अधिक आंका। सबसे अच्छे प्रदर्शन करने वालों ने खुद को कम आंका। बीच वाले, कमोबेश जानते थे कि वे कहाँ खड़े हैं।

A psychology experiment room shows participants completing a skills test at separate desks
A psychology experiment room shows participants completing a skills test at separate desks Illustration · AI-generated (FLUX.1-dev)

डनिंग और क्रूगर का तर्क यह नहीं था कि अक्षम लोग अहंकारी होते हैं। यह कुछ अधिक असहज करने वाला था: जिस कौशल की आवश्यकता आपको किसी कार्य को करने के लिए होती है, वही कौशल यह मूल्यांकन करने के लिए भी चाहिए होता है कि आपने उसे अच्छी तरह से किया है या नहीं। एक नौसिखिया ड्राइवर के पास इस बात का कोई आंतरिक पैमाना नहीं होता है कि अच्छी ड्राइविंग कैसी दिखती है, इसलिए जो कुछ भी उन्हें घर पहुँचा देता है वही सफलता मानी जाती है। एक बुरा लेखक विश्वसनीय रूप से एक अच्छे वाक्य और एक बुरे वाक्य के बीच अंतर नहीं बता सकता। क्षमता और आत्म-मूल्यांकन दो अलग-अलग संकाय नहीं हैं जो एक-दूसरे को ट्रैक करते हैं; वे काफी हद तक एक ही संकाय हैं।

Dunning–Kruger Effect 01
Dunning–Kruger Effect 01 忍者猫 · CC0 1.0

दर्पण छवि भी उतनी ही महत्वपूर्ण है। मजबूत प्रदर्शन करने वालों ने खुद को कम आंका क्योंकि उन्हें लगा कि यह कार्य सभी के लिए आसान था। विशेषज्ञता समस्या को छोटा दिखाती है। अज्ञानता इसे गायब कर देती है।

A driving lesson on a sunny suburban street captures early overconfidence physically: a ne
A driving lesson on a sunny suburban street captures early overconfidence physically: a ne Illustration · AI-generated (FLUX.1-dev)

सांख्यिकीय शिकायत

बाद के वर्षों में, इस प्रभाव ने अपना खुद का जीवन प्राप्त कर लिया है—एक साफ-सुथरा ग्राफ जिसमें "माउंट स्टुपिड का शिखर" और "निराशा की घाटी" है, जिसे प्रबंधन ब्लॉगों पर साझा किया जाता है, जो मूल पेपर में कभी दिखाई नहीं दिया। चार्ट मनगढ़ंत है। घाटी लोककथा है।

Dunning-kruger effect - simulation1
Dunning-kruger effect - simulation1 Phlsph7 · BY-SA 4.0

मूल प्रभाव को सांख्यिकीय आधार पर भी चुनौती दी गई है। 2017 में, Ed Nuhfer और उनके सहयोगियों ने तर्क दिया कि डनिंग और क्रूगर ने जो देखा, उसमें से अधिकांश regression to the mean (माध्य की ओर प्रतिगमन) की कलाकृति थी: यदि आप लोगों को प्रदर्शन के आधार पर छांटते हैं और फिर प्रत्येक से उनके रैंक का अनुमान लगाने के लिए कहते हैं, तो निचला समूह केवल ऊपर की ओर गलती कर सकता है और शीर्ष समूह केवल नीचे की ओर गलती कर सकता है। एक यादृच्छिक-शोर जनरेटर भी यही आकार पैदा करता है। Gilles Gignac और मार्सिन ज़ाजेंकोव्स्की 2020 में इसी तरह के निष्कर्षों पर पहुँचे, उन्होंने सिम्युलेटेड डेटा के साथ वक्र को दोहराया जिसमें कोई डनिंग-क्रूगर प्रभाव था ही नहीं।

डनिंग ने जवाब दिया है कि यह पैटर्न प्रतिगमन के नियंत्रण के बाद भी जीवित रहता है, और यह प्रभाव सबसे दृढ़ता से तब दिखाई देता है जब लोगों को साथियों का प्रदर्शन देखने के बाद अपने अनुमानों को संशोधित करने का मौका दिया जाता है और वे फिर भी अपने मूल आत्मविश्वास से चिपके रहते हैं। घटना शायद वास्तविक है, लेकिन कार्टून संस्करण के संकेत की तुलना में छोटी और कम सार्वभौमिक है।

A library study room shows the opposite side of competence: an expert surrounded by practi
A library study room shows the opposite side of competence: an expert surrounded by practi Illustration · AI-generated (FLUX.1-dev)

हम अभी भी क्या नहीं जानते हैं

हम नहीं जानते कि यह प्रभाव कितना सामान्य-डोमेन है। मूल अध्ययन में शैक्षणिक कार्यों पर कॉर्नेल के स्नातक छात्रों का उपयोग किया गया था। शतरंज, चिकित्सा और आग्नेयास्त्र सुरक्षा में प्रतिकृतियां कुछ डोमेन में पैटर्न दिखाती हैं और अन्य में नहीं, और पूर्वी एशियाई नमूनों के अध्ययनों में कभी-कभी विपरीत आकार पाया गया है—निचले छोर पर कम आत्मविश्वास, जो संभवतः आत्म-प्रस्तुति के आसपास के विभिन्न सांस्कृतिक मानदंडों से जुड़ा है।

Dunning-Kruger Effect
Dunning-Kruger Effect https://commons.wikimedia.org/w/index.php?title=User:Diego_M · CC BY-SA 4.0

हम नहीं जानते कि क्या यह ठीक करने योग्य है। संक्षिप्त प्रतिक्रिया शायद ही कभी निचले चतुर्थक के अनुमानों को बहुत अधिक बदलती है। लंबा प्रशिक्षण कौशल और आत्म-मूल्यांकन दोनों में एक साथ सुधार करता है, जो मूल सिद्धांत के अनुकूल है लेकिन बाहर से किसी और के अत्यधिक आत्मविश्वास को प्रभावित करने के लिए कोई लीवर प्रदान नहीं करता है।

A group feedback session shows participants comparing their performance after seeing anony
A group feedback session shows participants comparing their performance after seeing anony Illustration · AI-generated (FLUX.1-dev)

और हम नहीं जानते कि सामाजिक रूप से इसके बारे में क्या किया जाए। असहज करने वाला निष्कर्ष यह है कि किसी भी कमरे में सबसे अधिक आश्वस्त रहने वाले लोगों की इस बात की संभावना सबसे अधिक होती है कि वे विषय को सबसे कम समझते हैं, और जो लोग उन्हें सही करने के लिए सबसे अच्छे से सुसज्जित हैं, उनके हिचकिचाने की संभावना सबसे अधिक होती है। बैठकें, चुनाव और भर्ती समितियां इसके लिए वजन करने के लिए नहीं बनाई गई हैं।

मैकआर्थर व्हीलर ने अपनी सजा काटी और एक शांत जीवन में वापस चले गए। वर्षों बाद, जब उनसे पूछा गया कि क्या वे अब समझ गए हैं कि नींबू के रस के साथ क्या गलत हुआ था, तो उन्होंने कथित तौर पर कहा कि वे अभी भी नहीं समझ पाए हैं कि कैमरों ने उन्हें क्यों पकड़ा था। उनका दावा था कि रस ताजा था।

Pada tahun 1995, seorang pria merampok dua bank di Pittsburgh dengan mengoleskan jus lemon di wajahnya, percaya bahwa itu akan membuatnya tidak terlihat oleh kamera. Seorang psikolog Cornell membaca tentang kasus ini, tidak bisa melupakannya, dan mengubahnya menjadi salah satu makalah yang paling banyak dikutip dalam psikologi modern.

Pada bulan April 1995, seorang pria bernama McArthur Wheeler berjalan masuk ke dua bank di Pittsburgh di siang bolong, tanpa topeng, tanpa penyamaran. Dia telah mengoleskan jus lemon di wajahnya. Jus lemon, menurut pemikirannya, digunakan sebagai tinta tidak terlihat — sehingga wajah yang dilapisi jus tersebut tidak akan muncul di kamera keamanan. Kamera-kamera merekamnya dengan jelas. Dia ditangkap dalam hitungan jam. Ketika para detektif memutar rekaman itu untuknya, dia menatapnya dan berkata: "Tapi saya memakai jus itu."

Kisah tersebut masuk ke World Almanac tahun 1996, di mana seorang psikolog Cornell bernama David Dunning membacanya. Dunning tidak bisa berhenti memikirkannya. Wheeler tidak delusional dalam arti klinis dan tidak mabuk. Dia memiliki teori tentang dunia, telah mengujinya secara kasar (dia melaporkan bahwa foto Polaroid yang diambil dengan jus di wajahnya keluar dalam keadaan kosong, mungkin karena dia telah mengarahkan kamera ke langit-langit), dan telah bertindak berdasarkan teori tersebut dengan keyakinan penuh. Yang tidak dia miliki adalah perangkat metakognitif untuk menyadari bahwa teorinya salah.

Dunning-kruger effect - percentile
Dunning-kruger effect - percentile Phlsph7 · BY-SA 4.0

Bersama mahasiswa pascasarjananya Justin Kruger, Dunning merancang eksperimen. Mereka memberikan tes kepada mahasiswa sarjana Cornell dalam tiga domain — penalaran logis, tata bahasa Inggris, dan humor yang dinilai berdasarkan panel komedian profesional — dan meminta setiap mahasiswa untuk memperkirakan seberapa baik kinerja mereka dibandingkan dengan rekan-rekannya. Makalah tahun 1999 yang menyusul, Unskilled and Unaware of It, adalah salah satu makalah yang paling banyak dikutip dan paling banyak salah dibaca dalam psikologi modern.

Simetri yang kejam

Temuannya spesifik dan aneh. Mahasiswa di kuartil bawah, yang menjawab dengan benar kurang dari empat dari sepuluh pertanyaan, rata-rata percaya bahwa mereka mendapat skor di persentil ke-62. Kuartil atas, yang sebenarnya berada di sekitar persentil ke-86, memperkirakan mereka telah mencapai persentil ke-70. Yang terburuk menilai diri mereka terlalu tinggi. Yang terbaik menilai diri mereka terlalu rendah. Yang berada di tengah, kurang lebih, tahu di mana posisi mereka.

A psychology experiment room shows participants completing a skills test at separate desks
A psychology experiment room shows participants completing a skills test at separate desks Illustration · AI-generated (FLUX.1-dev)

Argumen Dunning dan Kruger bukanlah bahwa orang-orang yang tidak kompeten itu arogan. Itu adalah sesuatu yang lebih tidak nyaman: keterampilan yang Anda butuhkan untuk melakukan suatu tugas adalah keterampilan yang sama dengan yang Anda butuhkan untuk mengevaluasi apakah Anda telah melakukannya dengan baik. Seorang pengemudi pemula tidak memiliki tolok ukur internal tentang seperti apa mengemudi yang baik itu, sehingga apa pun yang membawa mereka pulang dianggap sebagai kesuksesan. Penulis yang buruk tidak dapat secara andal membedakan kalimat yang baik dari yang buruk. Kompetensi dan penilaian diri bukanlah dua kemampuan terpisah yang kebetulan saling mengikuti; sebagian besar adalah kemampuan yang sama.

Dunning–Kruger Effect 01
Dunning–Kruger Effect 01 忍者猫 · CC0 1.0

Citra cermin sama pentingnya. Orang-orang dengan kinerja kuat menilai diri mereka sendiri terlalu rendah karena mereka berasumsi bahwa tugas tersebut mudah bagi semua orang. Keahlian membuat masalah terlihat lebih kecil. Ketidaktahuan membuatnya lenyap.

A driving lesson on a sunny suburban street captures early overconfidence physically: a ne
A driving lesson on a sunny suburban street captures early overconfidence physically: a ne Illustration · AI-generated (FLUX.1-dev)

Keluhan statistik

Di tahun-tahun berikutnya, efek ini telah memperoleh kehidupannya sendiri — grafik rapi dengan "Puncak Gunung Kebodohan" dan "Lembah Keputusasaan" yang disebarkan di blog manajemen dan tidak pernah muncul di makalah aslinya. Bagan tersebut adalah rekaan. Lembah tersebut adalah cerita rakyat.

Dunning-kruger effect - simulation1
Dunning-kruger effect - simulation1 Phlsph7 · BY-SA 4.0

Efek aslinya juga telah ditantang atas dasar statistik. Pada tahun 2017, Ed Nuhfer dan rekan-rekannya berpendapat bahwa sebagian besar dari apa yang dilihat Dunning dan Kruger adalah artefak regression to the mean (regresi ke mean): jika Anda mengurutkan orang berdasarkan kinerja dan kemudian meminta masing-masing untuk memperkirakan peringkat mereka, kelompok bawah hanya bisa salah ke atas dan kelompok atas hanya bisa salah ke bawah. Generator kebisingan acak menghasilkan bentuk yang sama. Gilles Gignac dan Marcin Zajenkowski mencapai kesimpulan serupa pada tahun 2020, mereplikasi kurva dengan data simulasi yang sama sekali tidak mengandung efek Dunning-Kruger.

Dunning menanggapi bahwa pola tersebut bertahan dari kontrol regresi, dan bahwa efek tersebut muncul paling kuat ketika orang-orang diberi kesempatan untuk merevisi perkiraan mereka setelah melihat kinerja rekan sejawat dan masih tetap berpegang pada keyakinan awal mereka. Fenomena ini mungkin nyata, tetapi lebih kecil dan kurang universal daripada yang tersirat dalam versi kartun.

A library study room shows the opposite side of competence: an expert surrounded by practi
A library study room shows the opposite side of competence: an expert surrounded by practi Illustration · AI-generated (FLUX.1-dev)

Apa yang masih belum kita ketahui

Kita tidak tahu seberapa umum domain efek tersebut. Studi asli menggunakan mahasiswa sarjana Cornell pada tugas akademis. Replikasi dalam catur, kedokteran, dan keselamatan senjata api menunjukkan pola tersebut di beberapa domain dan tidak di domain lain, dan studi dalam sampel Asia Timur kadang-kadang menemukan bentuk sebaliknya — kurang percaya diri pada kelompok bawah, kemungkinan terkait dengan norma budaya yang berbeda seputar presentasi diri.

Dunning-Kruger Effect
Dunning-Kruger Effect https://commons.wikimedia.org/w/index.php?title=User:Diego_M · CC BY-SA 4.0

Kita tidak tahu apakah itu dapat diperbaiki. Umpan balik singkat jarang menggeser perkiraan kuartil bawah secara signifikan. Pelatihan yang lebih lama meningkatkan keterampilan dan penilaian diri bersama-sama, yang cocok dengan teori aslinya tetapi tidak menawarkan pengaruh dari luar untuk mengatasi rasa percaya diri yang berlebihan dari orang lain.

A group feedback session shows participants comparing their performance after seeing anony
A group feedback session shows participants comparing their performance after seeing anony Illustration · AI-generated (FLUX.1-dev)

Dan kita tidak tahu apa yang harus dilakukan secara sosial. Konsekuensi yang tidak nyaman adalah bahwa orang-orang yang paling yakin di ruangan mana pun kemungkinan besar secara tidak proporsional adalah orang-orang yang paling tidak memahami topik tersebut, dan orang-orang yang paling siap untuk mengoreksi mereka kemungkinan besar secara tidak proporsional akan ragu-ragu. Rapat, pemilihan umum, dan komite perekrutan tidak dirancang untuk menimbang hal ini.

McArthur Wheeler menjalani hukumannya dan kembali ke kehidupan yang tenang. Ditanya, bertahun-tahun kemudian, apakah dia sekarang mengerti apa yang salah dengan jus lemon itu, dia dilaporkan mengatakan bahwa dia masih tidak mengerti mengapa kamera menangkapnya. Jus itu, tegasnya, masih segar.

En 1995, un homme a braqué deux banques de Pittsburgh après s'est appliqué du jus de citron sur le visage, persuadé que cela le rendrait invisible aux caméras. Un psychologue de Cornell a lu un article sur cette affaire, n'a pas pu l'oublier et en a fait l'un des articles les plus cités de la psychologie moderne.

En avril 1995, un homme nommé McArthur Wheeler est entré dans deux banques de Pittsburgh en plein jour, sans masque ni déguisement. Il s'était enduit le visage de jus de citron. Le jus de citron, raisonnait-il, servait d'encre invisible — ainsi, un visage qui en était recouvert n'apparaîtrait pas sur les caméras de sécurité. Les caméras l'ont montré très clairement. Il a été arrêté en quelques heures. Lorsque les inspecteurs lui ont montré l'enregistrement, il l'a fixé du regard et a dit : « Mais j'avais mis le jus ».

L'histoire a été publiée dans le World Almanac de 1996, où un psychologue de Cornell nommé David Dunning l'a lue. Dunning ne pouvait pas s'empêcher d'y penser. Wheeler n'était pas délirant au sens clinique et n'était pas ivre. Il avait une théorie sur le monde, l'avait testée de manière rudimentaire (il a raconté qu'un Polaroid pris avec du jus sur le visage était ressorti blanc, probablement parce qu'il avait pointé l'appareil vers le plafond), et avait agi en conséquence avec une confiance absolue. Ce qui lui manquait, c'était l'équipement métacognitif nécessaire pour remarquer que sa théorie était fausse.

Dunning-kruger effect - percentile
Dunning-kruger effect - percentile Phlsph7 · BY-SA 4.0

Avec son étudiant de troisième cycle Justin Kruger, Dunning a conçu une expérience. Ils ont soumis des étudiants de Cornell à des tests dans trois domaines — le raisonnement logique, la grammaire anglaise et l'humour évalué par un panel de comédiens professionnels — et ont demandé à chaque étudiant d'estimer ses résultats par rapport à ses pairs. L'article de 1999 qui a suivi, Unskilled and Unaware of It, est l'un des articles les plus cités et les plus mal compris de la psychologie moderne.

La cruelle symétrie

Le résultat était spécifique et étrange. Les étudiants du quart inférieur, qui avaient répondu correctement à moins de quatre questions sur dix, pensaient en moyenne se situer au 62e percentile. Le quart supérieur, qui se situait en réalité autour du 86e percentile, estimait avoir atteint le 70e. Les moins bons se sont surestimés. Les meilleurs se sont sous-estimés. Ceux du milieu savaient à peu près où ils en étaient.

A psychology experiment room shows participants completing a skills test at separate desks
A psychology experiment room shows participants completing a skills test at separate desks Illustration · AI-generated (FLUX.1-dev)

L'argument de Dunning et Kruger n'était pas que les personnes incompétentes sont arrogantes. C'était quelque chose de plus dérangeant : les compétences dont vous avez besoin pour accomplir une tâche sont les mêmes que celles dont vous avez besoin pour évaluer si vous l'avez bien faite. Un conducteur novice n'a pas de repère interne pour savoir ce qu'est une bonne conduite, de sorte que tout trajet qui le ramène chez lui est considéré comme un succès. Un mauvais écrivain ne peut pas distinguer de manière fiable une bonne phrase d'une mauvaise. La compétence et l'auto-évaluation ne sont pas deux facultés distinctes qui coïncident ; elles sont, en grande partie, la même faculté.

Dunning–Kruger Effect 01
Dunning–Kruger Effect 01 忍者猫 · CC0 1.0

L'image miroir est tout aussi importante. Les personnes performantes se sous-estimaient parce qu'elles supposaient que la tâche était facile pour tout le monde. L'expertise donne l'impression que le problème est plus petit. L'ignorance le fait disparaître.

A driving lesson on a sunny suburban street captures early overconfidence physically: a ne
A driving lesson on a sunny suburban street captures early overconfidence physically: a ne Illustration · AI-generated (FLUX.1-dev)

La contestation statistique

Depuis lors, l'effet a pris son autonomie — un graphique soigné avec un « sommet du mont Stupide » et une « vallée du désespoir » circule sur les blogs de management alors qu'il n'est jamais apparu dans l'article original. Ce graphique est inventé, cette vallée relève du folklore.

Dunning-kruger effect - simulation1
Dunning-kruger effect - simulation1 Phlsph7 · BY-SA 4.0

L'effet initial a également été contesté sur des bases statistiques. En 2017, Ed Nuhfer et ses collègues ont soutenu qu'une grande partie de ce que Dunning et Kruger avaient observé était un artefact de la regression to the mean (régression vers la moyenne) : si vous triez les gens par performance et leur demandez d'estimer leur classement, le groupe du bas ne peut se tromper que vers le haut et le groupe du haut vers le bas. Un générateur de bruit aléatoire produit la même courbe. Gilles Gignac et Marcin Zajenkowski sont parvenus à des conclusions similaires en 2020, en reproduisant la courbe avec des données simulées ne contenant aucun effet Dunning-Kruger.

Dunning a répondu que le profil persistait après contrôle de la régression, et que l'effet apparaissait le plus fortement lorsque les sujets avaient l'occasion de réviser leurs estimations après avoir vu les performances de leurs pairs et s'accrochaient néanmoins à leur confiance initiale. Le phénomène est probablement réel, mais plus modeste et moins universel que ne le suggère la caricature.

A library study room shows the opposite side of competence: an expert surrounded by practi
A library study room shows the opposite side of competence: an expert surrounded by practi Illustration · AI-generated (FLUX.1-dev)

Ce que nous ignorons encore

We ignorons à quel point l'effet est généralisable à d'autres domaines. L'étude originale portait sur des étudiants de Cornell effectuant des tâches académiques. Les réplications aux échecs, en médecine et dans la sécurité des armes à feu montrent ce profil dans certains domaines et pas dans d'autres, et des études sur des échantillons d'Asie de l'Est ont parfois révélé la tendance inverse — une sous-confiance dans la tranche inférieure, peut-être liée à des normes culturelles différentes concernant la présentation de soi.

Dunning-Kruger Effect
Dunning-Kruger Effect https://commons.wikimedia.org/w/index.php?title=User:Diego_M · CC BY-SA 4.0

Nous ne savons pas si cet effet est corrigible. Un retour d'information succinct modifie rarement beaucoup les estimations du quart inférieur. Un apprentissage plus long améliore à la fois les compétences et l'auto-évaluation, ce qui correspond à la théorie originale mais n'offre aucun levier extérieur pour corriger l'excès de confiance de quelqu'un.

A group feedback session shows participants comparing their performance after seeing anony
A group feedback session shows participants comparing their performance after seeing anony Illustration · AI-generated (FLUX.1-dev)

Et nous ne savons pas comment réagir socialement à cela. Le corollaire inconfortable est que les personnes les plus affirmatives dans une pièce sont, de manière disproportionnée, susceptibles d'être celles qui comprennent le moins le sujet, et que les personnes les mieux équipées pour les corriger sont, de manière disproportionnée, susceptibles d'hésiter. Les réunions, les élections et les commissions de recrutement ne sont pas conçues pour corriger ce biais.

McArthur Wheeler a purgé sa peine et est retourné à une vie tranquille. Interrogé des années plus tard sur ce qui n'avait pas fonctionné avec le jus de citron, il aurait déclaré ne toujours pas comprendre pourquoi les caméras l'avaient repéré. Le jus de citron, soutenait-il, était frais.

1995年、ある男が顔にレモン汁を塗ればカメラに映らなくなると信じて、ピッツバーグの2つの銀行を襲撃した。コーネル大学の心理学者がこの事件について知り、どうしても見過ごすことができず、現代心理学で最も引用される論文の1つへと結実させた。

1995年4月、 McArthur Wheeler という名の男が、マスクも変装もせず、白昼堂々ピッツバーグの2つの銀行に押し入った。彼は顔にレモン汁を塗っていた。レモン汁はあぶり出しのインクとして使われるため、顔に塗れば防犯カメラに映らないと考えたのだ。カメラは彼の姿を鮮明に捉えていた。彼は数時間以内に逮捕された。刑事が録画テープを再生すると、彼はそれを凝視して言った。「でも、レモン汁を塗ったのに。」

この話は1996年の『ワールド・アルマナック(世界年鑑)』に掲載され、それをコーネル大学の心理学者 David Dunning が読んだ。ダニングはこのことが頭から離れなくなった。ホイーラーは臨床的な意味での妄想症ではなく、酔ってもいなかった。彼は世界に対する仮説を持ち、それを大雑把に検証し(顔にレモン汁を塗って撮影したポラロイド写真が真っ白になったと主張したが、这是単にカメラを天井に向けていたためと見られる)、完全な自信を持って行動に移した。彼に欠けていたのは、自身の仮説が間違っていることに気づくためのメタ認知能力だった。

Dunning-kruger effect - percentile
Dunning-kruger effect - percentile Phlsph7 · BY-SA 4.0

ダニングは大学院生の Justin Kruger とともに、ある実験を設計した。コーネル大学の学部生を対象に、論理的推論、英文法、プロのコメディアンの基準に照らしたユーモアの3分野でテストを行い、それぞれの学生に同級生と比べて自分がどの程度できたか予測させた。その後に発表された1999年の論文 Unskilled and Unaware of It は、現代心理学において最も引用され、かつ最も誤解されている論文の1つである。

残酷な非対称性

その結果は特異で奇妙なものだった。正答率が10問中4問未満の最下位クォーター(4分位数)の学生は、平均して自分たちが第62パーセンタイルに位置していると信じていた。一方、実際には第86パーセンタイル付近に位置していた最上位クォーターの学生は、自分たちを第70パーセンタイルと予測した。能力の低い者ほど過大評価し、高い者ほど過小評価した。中間の層は、多かれ少なかれ自分の実力を把握していた。

A psychology experiment room shows participants completing a skills test at separate desks
A psychology experiment room shows participants completing a skills test at separate desks Illustration · AI-generated (FLUX.1-dev)

ダニングとクルーガーの主張は、無能な人が傲慢であるということではない。もっと不都合な真実である。すなわち、あるタスクを実行するために必要なスキルは、そのタスクがうまくできたかどうかを評価するために必要なスキルと同一なのだ。初心者のドライバーは、何が良い運転なのかという内部基準を持たないため、無事に帰宅できれば何でも成功とみなす。悪文を書く書き手は、良い文章と悪い文章を確実に見分けることができない。能力と自己評価は、たまたま連動している2つの独立した能力ではなく、大部分において同じ能力なのである。

Dunning–Kruger Effect 01
Dunning–Kruger Effect 01 忍者猫 · CC0 1.0

鏡像も同様に重要である。優秀なパフォーマーが自己評価を低く見積もったのは、そのタスクが他の誰にとっても簡単であると仮定したためだった。専門知識は問題を小さく見せる。無知は問題を消し去る。

A driving lesson on a sunny suburban street captures early overconfidence physically: a ne
A driving lesson on a sunny suburban street captures early overconfidence physically: a ne Illustration · AI-generated (FLUX.1-dev)

統計的な反論

それ以来、この効果は独自の歩みを始め、マネジメント系ブログでよく見かける「馬鹿の壁の頂点」や「絶望の谷」といった小ぎれいなグラフが一人歩きするようになったが、これは元の論文には一度も登場していない。あのグラフは創作であり、絶望の谷は俗説である。

Dunning-kruger effect - simulation1
Dunning-kruger effect - simulation1 Phlsph7 · BY-SA 4.0

元の効果は統計的な根拠からも疑問視されている。2017年、 Ed Nuhfer らは、ダニングとクルーガーが観察したものの多くは regression to the mean (平均回帰)のアーティファクト(誤差)であると主張した。人々をパフォーマンス順に並べ、それぞれのランクを予測させた場合、下位のグループは上方に、上位のグループは下方にしか間違えようがない。ランダムノイズの発生器でも同じ形状が生成される。 Gilles Gignac と Marcin Zajenkowski は2020年に同様の結論に達し、ダニング=クルーガー効果が全く含まれないシミュレーションデータを用いて同じ曲線を再現した。

ダニングは、このパターンが回帰を制御した後も残ること、また、他者のパフォーマンスを見た後に予測を修正する機会が与えられても、依然として当初の自信にしがみつく場合に効果が最も強く現れると反論している。この現象はおそらく本物であるが、世間に流布している風刺画版が示すほど大きくも普遍的でもない。

A library study room shows the opposite side of competence: an expert surrounded by practi
A library study room shows the opposite side of competence: an expert surrounded by practi Illustration · AI-generated (FLUX.1-dev)

未だ解明されていない謎

この効果がどれほど分野横断的なものかは分かっていない。元の研究は、学術的な課題に取り組むコーネル大学の学生を対象としていた。チェス、医療、銃器安全における追試では、特定の分野ではパターンが見られるものの、他の分野では見られないことが示されており、東アジアのサンプルを対象とした研究では、自己呈示に関する文化的な規範の違いからか、下位層での自己評価の低さという逆の形状が観察されることもある。

Dunning-Kruger Effect
Dunning-Kruger Effect https://commons.wikimedia.org/w/index.php?title=User:Diego_M · CC BY-SA 4.0

これが修正可能かどうかは分かっていない。簡単なフィードバックでは、下位クォーターの予測を大きく修正することはほとんどできない。長期のトレーニングはスキルと自己評価の両方を同時に向上させるが、これは元の理論と一致するものの、外部から他者の過剰な自信を抑えるようなレバーにはならない。

A group feedback session shows participants comparing their performance after seeing anony
A group feedback session shows participants comparing their performance after seeing anony Illustration · AI-generated (FLUX.1-dev)

そして、社会的にこれにどう対処すべきかは分かっていない。不快な帰結として、どのような会議室においても最も自信に満ちている人はそのテーマを最も理解していない可能性が極めて高く、彼らを正すのに最適な能力を持つ人ほど言葉を濁す傾向がある。会議、選挙、採用委員会は、この非対称性を考慮するように設計されていない。

マッカーサー・ホイーラーは刑期を終え、静かな生活に戻った。数年後、レモン汁の何が間違っていたのか理解できたか尋ねられた際、彼はカメラがなぜ自分を捉えたのか未だに分からないと語ったという。レモン汁は新鮮だった、と彼は主張し続けた。

В 1995 году мужчина ограбил два банка в Питтсбурге, намазав лицо лимонным соком, полагая, что это сделает его невидимым для камер. Психолог из Корнелла прочитал об этом случае, не смог остаться равнодушным и превратил его в одну из самых цитируемых статей в современной психологии.

В апреле 1995 года мужчина по имени McArthur Wheeler вошел в два банка в Питтсбурге посреди дня, без маски и маскировки. Он намазал лицо лимонным соком. Он рассудил, что лимонный сок используется как невидимые чернила — значит, покрытое им лицо не появится на камерах безопасности. Камеры показали его со всей отчетливостью. Он был арестован в течение нескольких часов. Когда детективы включили ему запись, он уставился на нее и сказал: «Но я же намазался соком».

Эта история попала во Всемирный альманах 1996 года, где ее прочитал психолог из Корнелла по имени David Dunning. Даннинг не мог перестать думать об этом. Уиллер не страдал бредовым расстройством в клиническом смысле и не был пьян. У него была теория о мире, он грубо проверил ее (он сообщил, что снимок Polaroid, сделанный с соком на лице, оказался чистым, возможно, потому что он направил камеру в потолок) и действовал на ее основе с абсолютной уверенностью. Чего ему не хватало, так это метакогнитивного инструментария, чтобы заметить, что его теория неверна.

Dunning-kruger effect - percentile
Dunning-kruger effect - percentile Phlsph7 · BY-SA 4.0

Вместе со своим аспирантом Justin Kruger Даннинг разработал эксперимент. Они предложили студентам Корнелла тесты в трех областях — логическое мышление, английская грамматика и юмор, оцениваемый по критериям профессиональных комиков, — и попросили каждого студента оценить, насколько хорошо он справился по сравнению со сверстниками. Статья 1999 года, которая за этим последовала, Unskilled and Unaware of It, стала одной из самых цитируемых и наиболее часто неверно истолковываемых работ в современной психологии.

Жестокая симметрия

Результат оказался специфическим и странным. Студенты из нижнего квартиля, ответившие правильно менее чем на четыре вопроса из десяти, в среднем считали, что они набрали баллы на уровне 62-го процентиля. Верхний квартиль, фактически оказавшийся около 86-го процентиля, оценил свой результат на уровне 70-го. Худшие переоценили себя. Лучшие недооценили себя. Средние более или менее знали, где они находятся.

A psychology experiment room shows participants completing a skills test at separate desks
A psychology experiment room shows participants completing a skills test at separate desks Illustration · AI-generated (FLUX.1-dev)

Аргумент Даннинга и Крюгера заключался не в том, что некомпетентные люди высокомерны. Было показано нечто более неудобное: навыки, которые нужны вам для выполнения задачи, — это те же самые навыки, которые нужны вам для оценки того, насколько хорошо вы ее выполнили. У начинающего водителя нет внутреннего мерила того, как выглядит хорошее вождение, поэтому все, что доставляет его домой, считается успехом. Плохой писатель не может надежно отличить хорошее предложение от плохого. Компетентность и самооценка — это не две отдельные способности, которые случайно отслеживают друг друга; в значительной степени это одна и та же способность.

Dunning–Kruger Effect 01
Dunning–Kruger Effect 01 忍者猫 · CC0 1.0

Зеркальное отражение столь же важно. Сильные исполнители недооценивали себя, поскольку предполагали, что задача легка для всех. Опыт делает проблему меньше на вид. Невежество заставляет ее исчезнуть.

A driving lesson on a sunny suburban street captures early overconfidence physically: a ne
A driving lesson on a sunny suburban street captures early overconfidence physically: a ne Illustration · AI-generated (FLUX.1-dev)

Статистическое возражение

За прошедшие годы эффект обрел собственную жизнь — аккуратный график с «Пиком горы Глупости» и «Долиной отчаяния», который кочует по менеджерским блогам, никогда не появлялся в оригинальной статье. Этот график выдуман. Долина — фольклор.

Dunning-kruger effect - simulation1
Dunning-kruger effect - simulation1 Phlsph7 · BY-SA 4.0

Оригинальный эффект также оспаривался по статистическим причинам. В 2017 году Ed Nuhfer с коллегами доказали, что многое из увиденного Даннингом и Крюгером было артефактом regression to the mean (регрессии к среднему): если отсортировать людей по показателям и попросить каждого оценить свой ранг, нижняя группа может ошибаться только в большую сторону, а верхняя — только в меньшую. Генератор случайного шума дает точно такую же форму. Gilles Gignac и Марчин Заенковски пришли к аналогичным выводам в 2020 году, воссоздав кривую на симулированных данных, которые вообще не содержали эффекта Даннинга-Крюгера.

Даннинг возразил, что паттерн выдерживает контроль на регрессию, и что эффект проявляется сильнее всего, когда людям дают возможность пересмотреть свои оценки после ознакомления с результатами сверстников, а они все равно цепляются за свою первоначальную уверенность. Феномен, вероятно, реален, но выражен слабее и менее универсален, чем предполагает его карикатурная версия.

A library study room shows the opposite side of competence: an expert surrounded by practi
A library study room shows the opposite side of competence: an expert surrounded by practi Illustration · AI-generated (FLUX.1-dev)

Чего мы до сих пор не знаем

Мы не знаем, насколько эффект применим к разным сферам. В оригинальном исследовании использовались академические задачи студентов Корнелла. Воспроизведения в шахматах, медицине и безопасности обращения с оружием показывают этот паттерн в одних областях и не показывают в других, а исследования на восточноазиатских выборках иногда выявляли противоположную картину — недооценку в нижнем сегменте, возможно, связанную с иными культурными нормами самопрезентации.

Dunning-Kruger Effect
Dunning-Kruger Effect https://commons.wikimedia.org/w/index.php?title=User:Diego_M · CC BY-SA 4.0

Мы не знаем, поддается ли это исправлению. Краткая обратная связь редко сильно сдвигает оценки нижнего квартиля. Более длительное обучение улучшает как навыки, так и самооценку вместе, что соответствует первоначальной теории, но не дает рычагов для воздействия на чужую сверхуверенность извне.

A group feedback session shows participants comparing their performance after seeing anony
A group feedback session shows participants comparing their performance after seeing anony Illustration · AI-generated (FLUX.1-dev)

И мы не знаем, что с этим делать в социальном плане. Неудобное следствие заключается в том, что люди, наиболее уверенные в любой аудитории, с непропорционально высокой вероятностью хуже всех разбираются в теме, а люди, наиболее подготовленные для их исправления, с непропорционально высокой вероятностью будут сомневаться. Совещания, выборы и приемные комиссии не приспособлены для учета этого фактора.

Макартур Уиллер отбыл наказание и вернулся к тихой жизни. Спустя годы, когда его спросили, понимает ли он теперь, что пошло не так с лимонным соком, он, по сообщениям, сказал, что до сих пор не понимает, почему камеры его засняли. Сок, настаивал он, был свежим.

Im Jahr 1995 raubte ein Mann zwei Banken in Pittsburgh aus, nachdem er sich Zitronensaft ins Gesicht geschmiert hatte, in dem Glauben, dass er dadurch für Kameras unsichtbar würde. Ein Psychologe aus Cornell las von dem Fall, ließ ihn nicht mehr los und machte daraus eine der am häufigsten zitierten Arbeiten der modernen Psychologie.

Im April 1995 betrat ein Mann namens McArthur Wheeler am helllichten Tag zwei Banken in Pittsburgh, ohne Maske, ohne Verkleidung. Er hatte sich Zitronensaft ins Gesicht geschmiert. Zitronensaft, so seine Argumentation, wurde als Geheimtinte verwendet – ein damit bestrichenes Gesicht würde also auf den Überwachungskameras nicht zu sehen sein. Die Kameras zeigten ihn überaus deutlich. Er wurde innerhalb weniger Stunden verhaftet. Als die Ermittler ihm das Band vorspielten, starrte er es an und sagte: „Aber ich habe doch den Saft getragen.“

Die Geschichte schaffte es in den World Almanac von 1996, wo sie ein Psychologe aus Cornell namens David Dunning las. Dunning konnte nicht aufhören, darüber nachzudenken. Wheeler war im klinischen Sinne nicht wahnhaft und er war nicht betrunken. Er hatte eine Theorie über die Welt, hatte sie grob getestet (er berichtete, dass ein Polaroid, das mit Saft im Gesicht aufgenommen wurde, weiß blieb, möglicherweise weil er die Kamera an die Decke gerichtet hatte) und hatte mit vollem Vertrauen danach gehandelt. Was ihm fehlte, war das metakognitive Rüstzeug, um zu bemerken, dass seine Theorie falsch war.

Dunning-kruger effect - percentile
Dunning-kruger effect - percentile Phlsph7 · BY-SA 4.0

Zusammen mit seinem Doktoranden Justin Kruger entwarf Dunning ein Experiment. Sie gaben Cornell-Studenten Tests in drei Bereichen – logisches Denken, englische Grammatik und Humor, der an den Bewertungen professioneller Komiker gemessen wurde – und baten jeden Studenten einzuschätzen, wie gut er im Vergleich zu seinen Kommilitonen abgeschnitten hatte. Die daraufhin 1999 veröffentlichte Arbeit Unskilled and Unaware of It ist eine der am häufigsten zitierten und am häufigsten missverstandenen Arbeiten der modernen Psychologie.

Die grausame Symmetrie

Das Ergebnis war spezifisch und merkwürdig. Studenten im untersten Quartil, die weniger als vier von zehn Fragen richtig beantwortet hatten, glaubten im Durchschnitt, im 62. Perzentil gepunktet zu haben. Das oberste Quartil, das tatsächlich um das 86. Perzentil herum lag, schätzte, das 70. erreicht zu haben. Die Schlechtesten überschätzten sich. Die Besten unterschätzten sich. Die Mitte wusste mehr oder weniger, wo sie stand.

A psychology experiment room shows participants completing a skills test at separate desks
A psychology experiment room shows participants completing a skills test at separate desks Illustration · AI-generated (FLUX.1-dev)

Dunning und Krugers Argument war nicht, dass inkompetente Menschen arrogant sind. Es war etwas Unangenehmeres: Die Fähigkeiten, die man braucht, um eine Aufgabe zu erledigen, sind dieselben Fähigkeiten, die man braucht, um zu beurteilen, ob man sie gut erledigt hat. Ein Fahranfänger hat keinen internen Maßstab dafür, wie gutes Fahren aussieht, also gilt alles, was ihn nach Hause bringt, als Erfolg. Ein schlechter Schriftsteller kann einen guten Satz nicht verlässlich von einem schlechten unterscheiden. Kompetenz und Selbsteinschätzung sind nicht zwei getrennte Fähigkeiten, die sich zufällig gegenseitig verfolgen; sie sind zu einem großen Teil dieselbe Fähigkeit.

Dunning–Kruger Effect 01
Dunning–Kruger Effect 01 忍者猫 · CC0 1.0

Das Spiegelbild ist ebenso wichtig. Starke Performer unterschätzten sich selbst, weil sie davon ausgingen, dass die Aufgabe für jeden einfach war. Fachwissen lässt das Problem kleiner erscheinen. Ignoranz lässt es verschwinden.

A driving lesson on a sunny suburban street captures early overconfidence physically: a ne
A driving lesson on a sunny suburban street captures early overconfidence physically: a ne Illustration · AI-generated (FLUX.1-dev)

Die statistische Rüge

In den Jahren seither hat der Effekt ein Eigenleben entwickelt – eine saubere Grafik mit einem „Gipfel des Mount Stupid“ und einem „Tal der Verzweiflung“, die in Management-Blogs herumgereicht wird, aber in der Originalarbeit nie vorkam. Das Diagramm ist erfunden. Das Tal ist Folklore.

Dunning-kruger effect - simulation1
Dunning-kruger effect - simulation1 Phlsph7 · BY-SA 4.0

Der ursprüngliche Effekt wurde auch aus statistischen Gründen angezweifelt. Im Jahr 2017 argumentierten Ed Nuhfer und Kollegen, dass vieles von dem, was Dunning und Kruger sahen, ein Artefakt der regression to the mean (Regression zur Mitte) war: Wenn man Menschen nach Leistung sortiert und dann jeden bittet, seinen Rang einzuschätzen, kann die unterste Gruppe nur nach oben irren und die oberste Gruppe nur nach unten. Ein Zufallsrauschgenerator erzeugt dieselbe Form. Gilles Gignac und Marcin Zajenkowski kamen 2020 zu ähnlichen Schlussfolgerungen und replizierten die Kurve mit simulierten Daten, die überhaupt keinen Dunning-Kruger-Effekt enthielten.

Dunning hat darauf geantwortet, dass das Muster Kontrollen für die Regression übersteht und dass der Effekt am stärksten in Erscheinung tritt, wenn Menschen die Möglichkeit erhalten, ihre Einschätzungen zu revidieren, nachdem sie die Leistung von Gleichrangigen gesehen haben, und dennoch an ihrer ursprünglichen Zuversicht festhalten. Das Phänomen ist wahrscheinlich real, aber kleiner und weniger universell, als die Karikaturversion impliziert.

A library study room shows the opposite side of competence: an expert surrounded by practi
A library study room shows the opposite side of competence: an expert surrounded by practi Illustration · AI-generated (FLUX.1-dev)

Was wir noch immer nicht wissen

Wir wissen nicht, wie bereichsübergreifend der Effekt ist. Die ursprüngliche Studie untersuchte Cornell-Studenten bei akademischen Aufgaben. Replikationen im Schach, in der Medizin und im sicheren Umgang mit Schusswaffen zeigen das Muster in einigen Bereichen und in anderen nicht, und Studien in ostasiatischen Stichproben haben manchmal die umgekehrte Form gefunden – mangelndes Selbstvertrauen am unteren Ende, was möglicherweise mit anderen kulturellen Normen der Selbstdarstellung zusammenhängt.

Dunning-Kruger Effect
Dunning-Kruger Effect https://commons.wikimedia.org/w/index.php?title=User:Diego_M · CC BY-SA 4.0

Wir wissen nicht, ob er behebbar ist. Kurzes Feedback verschiebt die Einschätzungen des untersten Quartils selten um viel. Ein längeres Training verbessert sowohl die Fähigkeit als auch die Selbsteinschätzung gleichermaßen, was zur ursprünglichen Theorie passt, bietet aber keinen Hebel, um die Selbstüberschätzung eines anderen von außen zu beeinflussen.

A group feedback session shows participants comparing their performance after seeing anony
A group feedback session shows participants comparing their performance after seeing anony Illustration · AI-generated (FLUX.1-dev)

Und wir wissen nicht, was wir gesellschaftlich dagegen tun sollen. Das unangenehme Korollar ist, dass die Menschen, die in jedem Raum am sichersten auftreten, mit unverhältnismäßig hoher Wahrscheinlichkeit diejenigen sind, die das Thema am wenigsten verstehen, und die Menschen, die am besten gerüstet sind, sie zu korrigieren, mit unverhältnismäßig hoher Wahrscheinlichkeit zögern. Meetings, Wahlen und Einstellungsausschüsse sind nicht darauf ausgelegt, dies zu gewichten.

McArthur Wheeler verbüßte seine Strafe und kehrte in ein ruhiges Leben zurück. Jahre später gefragt, ob er nun verstanden habe, was mit dem Zitronensaft schiefgelaufen war, soll er gesagt haben, er verstehe immer noch nicht, warum die Kameras ihn erfasst hatten. Der Saft, so beharrte er, sei frisch gewesen.

1995년, 한 남성이 얼굴에 레몬즙을 바르면 카메라에 보이지 않게 될 것이라 믿고 피츠버그의 은행 두 곳을 털었다. 코넬 대학교의 한 심리학자가 이 사건을 접하고 깊이 빠져들었고, 이를 현대 심리학에서 가장 많이 인용되는 논문 중 하나로 발전시켰다.

1995년 4월, McArthur Wheeler라는 이름의 남성이 마스크나 변장도 하지 않은 채 대낮에 피츠버그의 은행 두 곳으로 걸어 들어갔다. 그는 얼굴에 레몬즙을 바른 상태였다. 그는 레몬즙이 비밀 잉크로 사용된다는 점에 착안하여, 그것을 얼굴에 바르면 보안 카메라에 찍히지 않을 것이라고 추론했다. 카메라들은 그를 선명하게 보여주었다. 그는 몇 시간 만에 체포되었다. 형사들이 그에게 녹화 테이프를 틀어주자, 그는 그것을 멍하니 바라보며 말했다. "하지만 전 즙을 발랐는데요."

이 이야기는 1996년 '월드 알마낙(세계 연감)'에 실렸고, 코넬 대학교의 심리학자 David Dunning이 이를 읽게 되었다. 더닝은 이 생각을 머릿속에서 지울 수 없었다. 휠러는 임상적인 의미에서 망상 환자가 아니었으며 취하지도 않았다. 그는 세상에 대한 나름의 이론을 가지고 있었고, 그것을 거칠게 테스트해 보았으며(얼굴에 즙을 바르고 찍은 폴라로이드 사진이 빈 화면으로 나왔다고 말했는데, 이는 단순히 카메라를 천장으로 향했기 때문으로 보인다), 완전한 자신감을 가지고 행동에 옮겼다. 그에게 부족했던 것은 자신의 이론이 틀렸음을 알아차릴 수 있는 메타인지적 능력이었다.

Dunning-kruger effect - percentile
Dunning-kruger effect - percentile Phlsph7 · BY-SA 4.0

그의 대학원생 Justin Kruger와 함께 더닝은 실험을 설계했다. 그들은 코넬 대학교 학부생들에게 논리적 추론, 영어 문법, 그리고 전문 코미디언 배심원단이 평가한 유머라는 세 가지 영역의 테스트를 치르게 하고, 각 학생에게 동료들과 비교해 자신이 얼마나 잘했는지 예측해 보라고 요청했다. 그 후 발표된 1999년의 논문 Unskilled and Unaware of It은 현대 심리학에서 가장 많이 인용되면서도 동시에 가장 오해를 많이 받는 논문 중 하나이다.

잔인한 대칭성

그 결과는 구체적이고 기묘했다. 하위 25%에 속하며 10문제 중 4문제 미만으로 맞힌 학생들은 평균적으로 자신이 상위 62% 백분위수에 들어간다고 믿었다. 반면 실제로 상위 86% 백분위수 근처에 위치했던 상위 25%의 학생들은 자신이 70% 백분위수에 도달했다고 추정했다. 가장 능력이 부족한 사람들이 과대평가했고, 가장 우수한 사람들이 과소평가했다. 중간층은 다소나마 자신이 어디쯤 서 있는지 알고 있었다.

A psychology experiment room shows participants completing a skills test at separate desks
A psychology experiment room shows participants completing a skills test at separate desks Illustration · AI-generated (FLUX.1-dev)

더닝과 크루거의 논지는 무능한 사람들이 거만하다는 것이 아니었다. 그것은 훨씬 더 불편한 진실이었다. 즉, 어떤 작업을 수행하는 데 필요한 기술은 자신이 그것을 잘 수행했는지 평가하는 데 필요한 기술과 동일하다는 점이다. 초보 운전자는 좋은 운전이 어떤 것인지에 대한 내부적인 기준이 없기 때문에 자신을 집에 무사히 데려다주는 주행은 무엇이든 성공으로 간주한다. 글을 잘 쓰지 못하는 작가는 좋은 문장과 나쁜 문장을 확실하게 구별할 수 없다. 능력과 자기 평가는 서로를 따라가는 별개의 두 능력이 아니며, 대부분 같은 능력이다.

Dunning–Kruger Effect 01
Dunning–Kruger Effect 01 忍者猫 · CC0 1.0

그 반대 이미지도 마찬가지로 중요하다. 뛰어난 성과를 내는 사람들이 자신을 과소평가한 이유는 그 작업이 다른 모든 사람에게도 쉬울 것이라고 가정했기 때문이다. 전문 지식은 문제를 더 작아 보이게 만든다. 무지는 문제를 사라지게 만든다.

A driving lesson on a sunny suburban street captures early overconfidence physically: a ne
A driving lesson on a sunny suburban street captures early overconfidence physically: a ne Illustration · AI-generated (FLUX.1-dev)

통계적 이의 제기

그 후 수년 동안 이 효과는 독자적인 생명력을 얻게 되었다. '우매함의 봉우리'와 '절망의 계곡'이 그려진 깔끔한 그래프가 경영 블로그 등에서 널리 공유되었지만, 이는 원본 논문에는 결코 나타나지 않았던 그림이다. 그 차트는 허구이며 계곡은 민간 전설이다.

Dunning-kruger effect - simulation1
Dunning-kruger effect - simulation1 Phlsph7 · BY-SA 4.0

원본 효과는 통계적 근거에서도 도전을 받았다. 2017년 Ed Nuhfer 연구진은 더닝과 크루거가 관찰한 현상의 상당 부분이 regression to the mean(평균 회귀) 오류에서 비롯된 것이라고 주장했다. 사람들을 수행 능력 순서대로 정렬한 뒤 각자의 순위를 추정하게 하면, 하위 그룹은 위쪽으로만 오류를 낼 수 있고 상위 그룹은 아래쪽으로만 오류를 낼 수 있다는 논리다. 무작위 노이즈 생성기 역시 동일한 모양의 곡선을 만들어낸다. Gilles Gignac과 마르신 자옌코프스키는 2020년에 유사한 결론에 도달하며, 더닝-크루거 효과가 전혀 포함되지 않은 시뮬레이션 데이터를 사용하여 이 곡선을 재현했다.

더닝은 회귀 현상을 제어한 후에도 이 패턴이 여전히 유지되며, 동료들의 수행 능력을 확인하고 추정치를 수정할 기회를 주었을 때도 원래의 확신을 고수하는 경우에 효과가 가장 강하게 나타난다고 반론했다. 이 현상은 아마도 실제 존재하겠지만, 대중적인 캐리커처 버전이 암시하는 것보다 규모가 작고 덜 보편적일 것이다.

A library study room shows the opposite side of competence: an expert surrounded by practi
A library study room shows the opposite side of competence: an expert surrounded by practi Illustration · AI-generated (FLUX.1-dev)

우리가 여전히 모르는 것들

우리는 이 효과가 얼마나 보편적으로 적용되는지 알지 못한다. 원본 연구는 학술적 과제를 수행하는 코넬 대학교 학부생들을 대상으로 했다. 체스, 의학, 총기 안전 분야에서의 복제 연구들은 특정 분야에서는 패턴이 나타나지만 다른 분야에서는 나타나지 않음을 보여주며, 동아시아 샘플을 대상으로 한 연구에서는 하위권에서의 자신감 부족이라는 반대되는 형태가 관찰되기도 했는데 이는 자기 제시에 관한 상이한 문화적 규범과 연결되어 있을 수 있다.

Dunning-Kruger Effect
Dunning-Kruger Effect https://commons.wikimedia.org/w/index.php?title=User:Diego_M · CC BY-SA 4.0

우리는 그것이 극복 가능한지 알지 못한다. 짧은 피드백은 하위 25%의 추정치를 크게 변화시키지 못한다. 장기적인 훈련은 기술과 자기 평가를 함께 향상시키는데, 이는 원본 이론과 일치하지만 외부에서 타인의 과도한 자신감을 억제하는 데 쓸 수 있는 레버는 제공하지 못한다.

A group feedback session shows participants comparing their performance after seeing anony
A group feedback session shows participants comparing their performance after seeing anony Illustration · AI-generated (FLUX.1-dev)

그리고 우리는 사회적으로 이에 어떻게 대처해야 할지 알지 못한다. 불편한 귀결은 어느 방에서나 가장 확신에 찬 사람들이 그 주제를 가장 덜 이해하고 있을 가능성이 비정상적으로 높고, 그들을 교정하기에 가장 적합한 능력을 갖춘 사람일수록 주저할 가능성이 비정상적으로 높다는 점이다. 회의, 선거, 채용 위원회는 이러한 점을 감안하여 설계되지 않았다.

맥아서 휠러는 형기를 마치고 조용한 삶으로 돌아갔다. 수년 후, 레몬즙에 무엇이 잘못되었었는지 이제 이해하느냐는 질문을 받았을 때, 그는 여전히 카메라가 왜 자신을 포착했는지 모르겠다고 답변했다고 전해진다. 그는 레몬즙이 신선했다고 고집스럽게 주장했다.

Image sources & licenses (7)
  1. Dunning-kruger effect - percentile — Phlsph7, BY-SA 4.0. Source (openverse)
  2. Dunning–Kruger Effect 01 — 忍者猫, CC0 1.0. Source (openverse)
  3. Dunning-kruger effect - simulation1 — Phlsph7, BY-SA 4.0. Source (openverse)
  4. Dunning-Kruger Effect — https://commons.wikimedia.org/w/index.php?title=User:Diego_Moya, CC BY-SA 4.0. Source (wikipedia)
  5. Dunning Kruger effect — Nevit Dilmen (talk), CC BY-SA 3.0. Source (commons)
  6. Dunning-Kruger effect - simulation — Phlsph7, CC BY-SA 4.0. Source (commons)
  7. Dunning-Kruger effect - simulation — Phlsph7, CC BY-SA 4.0. Source (commons)

Mentioned in this article

Sources

  1. Kruger, J. & Dunning, D. (1999). "Unskilled and Unaware of It: How Difficulties in Recognizing One's Own Incompetence Lead to Inflated Self-Assessments." Journal of Personality and Social Psychology, 77(6), 1121–1134.
  2. Dunning, D. (2011). "The Dunning-Kruger Effect: On Being Ignorant of One's Own Ignorance." Advances in Experimental Social Psychology, 44, 247–296.
  3. Nuhfer, E., Cogan, C., Fleisher, S., Gaze, E. & Wirth, K. (2017). "How Random Noise and a Graphical Convention Subverted Behavioral Scientists' Explanations of Self-Assessment Data." Numeracy 10(1), Article 4.
  4. Gignac, G. E. & Zajenkowski, M. (2020). "The Dunning-Kruger effect is (mostly) a statistical artefact: Valid approaches to testing the hypothesis with individual differences data." Intelligence, 80, 101449.
Production storyboard

The 90-second video script behind this article.

EN script

The less you know, the more confident you are. The more you know, the more you doubt yourself. This is the Dunning-Kruger effect, and it explains every overconfident beginner you've ever met. In 1999, psychologists David Dunning and Justin Kruger tested students on logic, grammar, and humor. The worst performers rated themselves above average. The best performers? They underestimated their scores. Here's why: when you're bad at something, you lack the skills to recognize you're bad. It's a brutal catch-22. The knowledge needed to be competent is the same knowledge needed to recognize incompetence. Think about learning to drive. Day one, you're fearless—how hard can it be? Week two, you realize you're terrible. Month three, you start getting good but feel worse about your skills. This is the 'valley of despair'—the painful dip where you finally know enough to see how much you don't know. Experts live in permanent uncertainty because they see the full complexity. The danger? Confident idiots get promoted while qualified people stay quiet. The solution isn't false humility. It's calibrated confidence. Ask yourself: how would I know if I were wrong? Seek feedback. Find blind spots. True expertise isn't knowing everything—it's knowing exactly what you don't know.

HI script

Jitna kam jaante ho, utna zyada confident. Jitna zyada jaante ho, utna zyada doubt.

Jitna kam jaante ho, utna zyada confident. Jitna zyada jaante ho, utna zyada doubt. Yeh hai Dunning-Kruger effect, aur yeh explain karta hai har overconfident beginner ko jo aapne kabhi dekha hai. 1999 mein psychologists David Dunning aur Justin Kruger ne students ko logic, grammar, aur humor pe test kiya. Sabse bure performers ne khud ko above average rate kiya. Sabse acche performers? Unhone apne scores underestimate kiye. Yeh kyun hota hai: jab aap kisi cheez mein bure ho, aapke paas skills nahi hain yeh recognize karne ki ki aap bure ho. Yeh ek brutal catch-22 hai. Competent hone ke liye jo knowledge chahiye, wahi knowledge chahiye incompetence recognize karne ke liye. Driving seekhna socho. Pehle din, aap fearless ho—kitna mushkil ho sakta hai? Dusre hafte, realize hota hai ki aap terrible ho. Teesre mahine, acche hone lagte ho par feel worse karte ho apni skills ke baare mein. Yeh hai 'valley of despair'—woh painful dip jahan finally itna pata chal jaata hai ki realize ho ki kitna nahi pata. Experts permanent uncertainty mein rehte hain kyunki woh poori complexity dekhte hain. Danger kya hai? Confident idiots promote ho jaate hain jabki qualified log chup rehte hain. Solution false humility nahi hai. Calibrated confidence hai. Khud se pucho: mujhe kaise pata chalega agar main galat hun? Feedback lo. Blind spots dhundho. True expertise sab kuch jaanna nahi hai—yeh jaanna hai ki exactly kya nahi pata.

  1. 01

    A statistics lab recreates the Dunning-Kruger curve debate physically with sorted stacks of identical wooden blocks representing performance groups and separate estimate tokens placed beside them.

  2. 02

    A psychology experiment room shows participants completing a skills test at separate desks while confidence is expressed through body language: one person leans back too soon, another checks work slowly, a researcher collects answer sheets face down.

  3. 03

    A driving lesson on a sunny suburban street captures early overconfidence physically: a new driver grips the wheel loosely, smiling, while the instructor's foot hovers near a dual brake and their hand stays ready near the front console.

  4. 04

    A library study room shows the opposite side of competence: an expert surrounded by practice materials pauses with a furrowed brow, aware of what remains uncertain. Nearby, a beginner's small stack of solved puzzles sits too neatly closed.

  5. 05

    A group feedback session shows participants comparing their performance after seeing anonymous peer outcomes represented by unmarked tokens on a table. One person holds onto their original estimate token despite the new arrangement, while others adjust theirs.

  6. 06

    A bank-security interview room evokes the famous lemon-juice robber story without ridicule: a confused suspect watches a blurred surveillance monitor turned away from the viewer while detectives sit calmly across a plain table.