1. 生涯
ジョン・ワイルダー・テューキーは、その生涯を通じて多岐にわたる学術的・職業的貢献を果たしました。
1.1. 幼少期と教育
テューキーは、1915年6月16日にマサチューセッツ州ニューベッドフォードで生まれました。彼の父はラテン語教師、母は家庭教師であり、彼は主に母親から教育を受け、正規の学校教育はフランス語など特定の科目でのみ受講しました。
彼は1936年にブラウン大学で化学の学士号を、1937年に同大学で化学の修士号を取得しました。その後、プリンストン大学に進み、「位相空間における可算性について」(On denumerability in topology)と題する博士論文を完成させ、1939年に数学の博士号を取得しました。
1.2. 第二次世界大戦と初期のキャリア
第二次世界大戦中、テューキーは火器管制研究局(Fire Control Research Office)で働き、サミュエル・ウィルクスやウィリアム・コックランといった著名な統計学者と共同研究を行いました。彼はU-2偵察機の設計にも貢献したとされています。終戦後、彼はプリンストン大学に戻り、大学とAT&Tベル研究所の両方で研究を続けました。1962年にはアメリカ哲学協会の会員に選出されました。
2. 職業経歴と所属
ジョン・テューキーは、プリンストン大学とベル研究所での研究活動を中心に、幅広い職業的貢献を行いました。また、様々な機関でのコンサルティングやアドバイザリー業務を通じて、その専門知識を社会に還元し、数々の栄誉を受賞しました。
2.1. プリンストン大学
テューキーは35歳でプリンストン大学の正教授となり、1965年には同大学の統計学部の創設者であり初代学科長を務め、学術的リーダーシップを発揮しました。
2.2. ベル研究所 (AT&T Bell Laboratories)
ベル研究所では、コンピュータ向け統計手法の開発に従事し、その後のコンピュータ科学の発展に大きな影響を与える基礎的な概念を生み出しました。
2.3. コンサルティングおよびアドバイザリー活動
1960年から1980年にかけて、テューキーはNBCテレビネットワークの世論調査の設計を支援し、選挙の予測と分析に貢献しました。また、エデュケーショナル・テスティング・サービス(ETS)、ゼロックス・コーポレーション、メルク・アンド・カンパニーなどの企業や組織のコンサルタントも務めました。1970年代から1980年代初頭にかけては、国家教育評価計画(National Assessment of Educational Progress)の設計と実施において重要な役割を果たしました。
2.4. 受賞歴と栄誉
テューキーは、その卓越した業績に対して数多くの賞と栄誉を授与されました。1973年には、当時のリチャード・ニクソン大統領からアメリカ合衆国が科学分野の功績に与える最高の栄誉であるアメリカ国家科学賞を授与されました。1982年には、「確率過程のスペクトル分析および高速フーリエ変換(FFT)アルゴリズムへの貢献」に対してIEEE栄誉賞を受賞しました。
3. 科学的貢献
ジョン・テューキーの科学的貢献は、統計学、コンピュータ科学、データ分析の分野にわたり、数々の革新的な業績と方法論を生み出しました。
3.1. 高速フーリエ変換 (FFT) アルゴリズム
テューキーは、ジェイムズ・クーリーと共に高速フーリエ変換(FFT)アルゴリズムを開発したことで特に知られています。これは1965年に共同で発表されたもので、信号処理、画像処理、科学計算など、様々な分野におけるデジタルデータの高速処理を可能にし、計算の効率を飛躍的に向上させました。FFTは、現代の科学技術に計り知れない影響を与えたアルゴリズムの一つとされています。
3.2. 探索的データ分析 (EDA) および統計技法
テューキーは、統計実践における柔軟なアプローチの重要性を強調し、数多くの革新的な統計技法を開発または普及させました。
彼は1977年の著書『Exploratory Data Analysis』で、データの分布を視覚的に要約する強力なツールである箱ひげ図を導入しました。また、彼は今日「ジャックナイフ法」(Quenouille-Tukey jackknife)として知られるリサンプリング法に1970年に大きく貢献しました。
テューキーの範囲検定、テューキーのラムダ分布、テューキーの加法性検定、タイヒミュラー・テューキーの補題、そしてテューキー窓といった統計的ツールや概念はすべて彼の名にちなんで名付けられています。彼はさらに、三項平均(trimean)や線形回帰のより簡単な代替手法である中央値-中央値線(median-median line)など、あまり知られていないいくつかの方法も考案しました。1974年には、ジェローム・H・フリードマンと共にプロジェクション・パースートの概念を開発し、多次元データを低次元空間に投影して探索する手法を提示しました。
3.3. データサイエンスの基礎
ジョン・テューキーは、統計実践とデータ分析全般に多大な貢献をしました。彼は、今日「データサイエンス」として知られる分野の多くの重要な基礎を築いたため、「データサイエンスの父」と見なされることもあります。
1960年代、テューキーは当時の統計学で優勢であった「確証的データ分析」、すなわち厳格な数学的構成に基づく統計分析のあり方に異議を唱えました。テューキーは、データ分析においてより柔軟な姿勢を持つこと、そしてデータにどのような構造や情報が含まれているかを注意深く探求することの重要性を強調しました。彼はこれを「探索的データ分析」(EDA)と呼びました。多くの点で、EDAは現代のデータサイエンスの先駆けとなりました。
テューキーはまた、EDAにとってコンピュータ科学が重要であると認識していました。グラフィックスはEDA手法の不可欠な部分であり、テューキーの研究の多くは(箱ひげ図のような)手描きも可能な静的表示に焦点を当てていましたが、コンピュータグラフィックスが多変量データの研究にはるかに効果的であると認識していました。彼は1970年代初頭に、多変量データを表示するための最初のプログラムであるPRIM-9を考案しました。データ分析とコンピュータ科学のこの結合が、現在「データサイエンス」と呼ばれている分野の核を形成しています。
テューキーは、探索的データ分析と確証的データ分析の重要な区別を明確にし、多くの統計手法が後者に過度の重点を置いていると考えていました。彼は両タイプの分析を分離することの有用性を信じていましたが、特に自然科学においてはこれが問題となる場合があることを指摘し、そのような状況を「不快な科学」(uncomfortable science)と名付けました。
A・D・ゴードンは、テューキーの統計実践の原則について以下の要約を提供しています。
- 数理統計学の有用性と限界。
- 使用の前提条件の違反に対して頑健な統計分析手法の重要性。
- 特定の方法の使用に関するガイダンスを提供するために、分析の特定の行動に関する経験を蓄積する必要性。
- データが分析方法の選択に影響を与える可能性を許容することの重要性。
- 統計家が「確立された真実の守護者」の役割を拒否し、一度限りの解決策や主題の行き過ぎた統一を提供しようとする試みに抵抗する必要性。
- データ分析の反復的な性質。
- 計算施設の能力、利用可能性、安価さの増大がもたらす影響。
- 統計家の養成。
4. 用語の創出
ジョン・テューキーは、現代の科学技術に大きな影響を与えた用語を創出しました。
彼は、初期のコンピュータ設計においてジョン・フォン・ノイマンと共同で作業していた際に、「bit」(binary digitバイナリー・ディジット英語の短縮形)という言葉を導入しました。「bit」という用語は、1948年にクロード・シャノンによる論文『通信の数学的理論』で初めて使用されました。
また、「ソフトウェア」という言葉の最初の出版物における使用もテューキーによるものとされています。この用語は、1958年のテューキーの論文(『アメリカ数学月報』誌)で確認されています。ポール・ニケットは1953年に自身がこの用語を作ったと主張していますが、印刷物での初出はテューキーの論文とされています。
5. データ分析への哲学とアプローチ
テューキーは、データ分析において確証的データ分析(CDA)の支配に異議を唱え、探索的データ分析(EDA)の重要性を強調しました。彼は、データに隠された構造や情報を発見するために、より柔軟で探求的なアプローチを取ることの必要性を説きました。この哲学は、「不快な科学」という概念にもつながっています。これは、特に自然科学において、探索と確証の間の明確な分離が困難な状況を指します。
ピーター・マッカローは、1977年にロンドンで行われたテューキーの講義を以下のように描写しています。
「テューキーは、だぶだぶのズボンと黒いニットシャツを着た大きなクマのような男で、ゆっくりと演台に向かって歩いた。これらはかつて揃いのものだったかもしれないが、あまりにも古くて区別がつかなかった。...彼は注意深く、意図的に黒板に見出しのリストをチョークで書いていった。言葉もまた、重すぎる小包のように、ゆっくりと淀みないペースで届けられた。...それが終わると、テューキーは聴衆と演台に向き直り...『コメント、質問、提案はありますか?』と聴衆に尋ねた。...返答を待ちながら、彼は演台によじ登り、あぐらをかいて聴衆と向き合うように体勢を整えた。...我々聴衆は、動物園の観客のように、大きなクマが動くか何かを言うのを待っていた。しかし、大きなクマも同じことをしているように見え、その感覚は心地よいものではなかった。」この描写は、テューキーの独特な講義スタイルと、彼の思想が聴衆に与えた深い印象を示しています。
6. 私生活
ジョン・テューキーの私生活に関する詳細は、公開されている情報源では限られていますが、彼は1985年に現役を引退しました。
7. 死去
ジョン・ワイルダー・テューキーは、2000年7月26日にニュージャージー州ニューブランズウィックで85歳で死去しました。
8. 遺産と評価
ジョン・テューキーは、その革新的な業績と哲学を通じて、統計学、コンピュータ科学、そして現代のデータ分析に計り知れない影響を与えました。
8.1. 肯定的な評価と業績
テューキーは、高速フーリエ変換(FFT)アルゴリズムの共同開発により、信号処理や科学計算の効率を飛躍的に向上させました。また、箱ひげ図やジャックナイフ法などの探索的データ分析(EDA)手法の提唱と普及は、統計家や研究者がデータにアプローチする方法を根本から変え、データの可視化と理解を大幅に改善しました。彼は「bit」や「ソフトウェア」といったコンピュータ科学の基礎用語を創出し、この分野の発展に不可欠な貢献をしました。彼のデータ分析に対する柔軟な哲学は、後のデータサイエンスの発展の土台となり、データに基づいた意思決定をより広く民主化する役割を果たしました。
8.2. 批判と論争
テューキーは、アメリカ統計学会の委員会に属し、アルフレッド・キンゼイによるキンゼイ報告の統計的手法を批判する報告書の作成に関与しました。この報告書『Statistical Problems of the Kinsey Report on Sexual Behavior in the Human Male』は、「ランダムに選ばれた3人のグループの方が、キンゼイ氏が選んだ300人のグループよりも良かっただろう」と結論付けるなど、報告書の統計的サンプリング方法論に対する厳格な評価を下しました。この批判は、報告書の内容自体ではなく、その統計的信頼性に対する専門的な疑義を提示するものでした。
8.3. 後世への影響
テューキーの業績、方法論、思想は、後代の科学者、学問分野、そして社会全体に具体的な影響を与え続けています。彼の提唱した探索的データ分析は、今日のビッグデータ時代におけるデータマイニングや機械学習の基礎概念として広く応用されています。彼の「不快な科学」という概念は、科学研究におけるデータの複雑性と不確実性を認識することの重要性を強調し、統計家が「確立された真実の守護者」ではなく、データから洞察を引き出す探求者としての役割を果たすべきだという彼の哲学は、現代の統計学教育と実践に深く根ざしています。また、彼はデータサイエンスという分野の先駆者として、統計学とコンピュータ科学の融合を促進し、現代のデータ駆動型社会の基盤を築きました。
9. 出版物
ジョン・W・テューキーは、数多くの書籍や論文を執筆または共同編集し、統計学とデータ分析の発展に大きく貢献しました。
- Andrews, David F.; Bickel, Peter J.; Hampel, Frank R.; Huber, Peter J.; Rogers, W. H.; Tukey, John Wilder (1972). Robust estimates of location: survey and advances. Princeton University Press.
- Basford, Kaye E.; Tukey, John Wilder (1998). Graphical Analysis of Multiresponse Data. Chapman & Hall/CRC Press.
- Blackman, R. B.; Tukey, John Wilder (1959). The measurement of power spectra from the point of view of communications engineering. Dover Publications.
- Cochran, William Gemmell; Mosteller, Charles Frederick; Tukey, John Wilder (1953). Statistical problems of the Kinsey report on sexual behavior in the human male. Journal of the American Statistical Association.
- Cooley, James W.; Tukey, John W. (1965). An algorithm for the machine calculation of complex Fourier series. Math. Comput., Vol. 19, No. 90, pp. 297-301.
- Hoaglin, David C.; Mosteller, Charles Frederick; Tukey, John Wilder (eds.) (1983). Understanding Robust and Exploratory Data Analysis. Wiley.
- Hoaglin, David C.; Mosteller, Charles Frederick; Tukey, John Wilder (eds.) (1985). Exploring Data Tables, Trends and Shapes. Wiley.
- Hoaglin, David C.; Mosteller, Charles Frederick; Tukey, John Wilder (eds.) (1991). Fundamentals of exploratory analysis of variance. Wiley.
- Morgenthaler, Stephan; Tukey, John Wilder (eds.) (1991). Configural polysampling: a route to practical robustness. Wiley.
- Mosteller, Charles Frederick; Tukey, John Wilder (1977). Data analysis and regression: a second course in statistics. Addison-Wesley.
- Tukey, John Wilder (1940). Convergence and Uniformity in Topology. Princeton University Press.
- Tukey, John Wilder (1977). Exploratory Data Analysis. Addison-Wesley.
- Tukey, John Wilder; Ross, Ian C.; Bertrand, Verna (1973). Index to statistics and probability. R & D Press.
;The collected works of John W Tukey, edited by William S. Cleveland
- Brillinger, David R. (ed.) (1984). Volume I: Time series, 1949-1964. Wadsworth, Inc.
- Brillinger, David R. (ed.) (1985). Volume II: Time series, 1965-1984. Wadsworth, Inc.
- Jones, Lyle V. (ed.) (1985). Volume III: Philosophy and principles of data analysis, 1949-1964. Wadsworth & Brooks/Cole.
- Jones, Lyle V. (ed.) (1986). Volume IV: Philosophy and principles of data analysis, 1965-1986. Wadsworth & Brooks/Cole.
- Cleveland, William S. (ed.) (1988). Volume V: Graphics, 1965-1985. Wadsworth & Brooks/Cole.
- Mallows, Colin L. (ed.) (1990). Volume VI: More mathematical, 1938-1984. Wadsworth & Brooks/Cole.
- Cox, David R. (ed.) (1992). Volume VII: Factorial and ANOVA, 1949-1962. Wadsworth & Brooks/Cole.
- Braun, Henry I. (ed.) (1994). Volume VIII: Multiple comparisons, 1949-1983. Chapman & Hall/CRC Press.