2026-02-012026-06-29

AI與數學家正面交鋒，數學難題一一被突破？2026年歷程全紀錄

隨著AI發展飛速前進，過往以為無法被攻克的「數學難題」領域，陸續也出現AI挑戰成功的新聞。

數學家會被AI取代嗎？AI還有甚麼無法破解的？

本系列文章將整理並記錄AI成功解出數學難題的新聞。

2026/01/15

AI會取代數學家嗎？陶哲軒：工具進步，不等於思考被取代

菲爾茲獎得主陶哲軒針對近期人工智慧頻頻攻克數學難題的現象出面降溫，提醒社會大眾應避免過度將 AI 「造神」。他指出，部分媒體將 AI 的解題成果誇大為完全自主與能力的跨越，卻忽略了其背後是透過龐大算力同時嘗試大量冷門或結構單純的問題，才在統計上放大了成功案例。

在現代科研中，AI 的實際定位更接近一套由快速檢索、定理驗證及大規模套用既有公式所組成的「工具鏈」。儘管 AI 能顯著提升研究效率，但包括問題的挑選、核心概念的創新以及深度的邏輯理解，仍高度依賴人類的思考與判斷。因此，高等數學研究的關鍵突破依然離不開人類的直覺，人機協作才是當前最具價值的發展模式。

https://ai.ettoday.net/news/3101537

2026/01/15

GPT-5.2 數學推理大躍進，15 分鐘解出埃爾德什問題

軟體工程師 Neel Somani 測試 OpenAI 的 GPT-5.2 模型時，意外發現系統能在 15 分鐘內，流暢運用 Legendre 公式與 Bertrand 猜想等工具，解出極為複雜的高階數學難題，甚至更完整地處理了傳奇數學家艾狄胥（Paul Erdős）的著名問題。

自 GPT-5.2 上線後，其數學推理能力展現顯著躍進。以艾狄胥問題網站為例，近期有 15 個開放問題被改列為「已解決」，其中高達 11 個解答明確提及 AI 的參與。菲爾茲獎得主陶哲軒對此指出，AI 已有多次具備實質數學意義的自主進展，因其具備良好可擴展性，極適合系統性地攻克那些長期乏人處理的「長尾」數學難題。此外，結合如 Lean 等證明助手與 AI 自動化形式化工具，更讓愈來愈多頂尖數學教授嚴肅看待並實際採用 AI，顯示人工智慧已正式納入當代高等數學的研究實務中。

https://technews.tw/2026/01/15/gpt-5-2-mathematical-reasoning/

2026/02/06

4 道長期未解數學題被 AI 破解：新創 Axiom 如何把 AI 推向「可驗證推理」的新階段？

專注於數學推理的 AI 新創公司 Axiom 成功開發出 AI 系統 AxiomProver，近期連續破解包括 Chen–Gendron 猜想、費爾猜想（Fel’s Conjecture）等四道長期未解的數學難題，引起學術與科技界極大關注。

該系統不同於傳統大語言模型的文字組合，而是將 LLM 與專有的 AI 系統結合，其核心特色在於能直接發展出新穎的解題方法，並自動將證明過程轉譯成 Lean 形式化語言進行機器與人類檢驗，實現「可驗證推理」並確保產出「可證明正確」的解答。這項進展不僅證實了 AI 系統具備全自動解題與即時驗證的能力，更在密碼學、量化金融、網路安全等需要高精度推理的領域中展現出巨大的商業潛力。

https://techorange.com/2026/02/06/axiom/

2026/02/14

情人節最硬核“Kiss”！中國AI突破300年親吻數難題，連刷多維度紀錄

中國開發的 AI 幾何求解系統 PackingStar 成功推進了困擾數學界長達 300 多年的幾何難題——「親吻數猜想」（Kissing Number Problem）。該問題旨在研究 $n$ 維空間中，一個球體周圍最多能同時容納多少個與之等大且不重疊的相切球體。

這款 AI 一舉打破了 25 至 31 維連續七個維度的世界紀錄，並在 13 和 14 維中發現了數千個超越過往文獻的新型幾何構型。此外，它還大幅刷新了多個維度的廣義兩球與三球親吻數紀錄。這次突破再次展現出 AI 在處理高維空間幾何與極值組合學問題時，具備遠超人類傳統計算的搜尋與空間建構能力。

https://hao.cnyes.com/post/232792

2026/02/23

數學家設下研究級試金石，OpenAI挑戰First Proof

來自史丹佛、哈佛與柏克萊等多所頂尖大學的數學家共同發表了《First Proof》挑戰賽，提出十道源自真實研究過程的數學問題。這項評估旨在打造更貼近真實學術環境的「試金石」，徹底堵死人工智慧過往透過「背答案」或記憶訓練數據來假裝擁有推理能力的漏洞，藉此檢驗 AI 是否具備自主完成研究級數學證明的核心實力。

面對這份嚴苛的全新基准測試，OpenAI 隨即公開旗下推理模型的十次證明嘗試，經專家初步評估，其中至少有五道題目極可能正確。這項挑戰不僅提供了一個評估下一代 AI 複雜推理能力的壓力測試場，也正式拉開了頂尖數學家與人工智慧在真實學術前沿的研究攻防戰。

https://www.ithome.com.tw/news/173991

2026/03/31

ChatGPT 首次獨立證明數學假設！AI 除了 vibe coding 更進步到「vibe proving」

比利時布魯塞爾自由大學的研究團隊發表最新研究，證實商用大語言模型 ChatGPT-5.2 Thinking 成功解開了幾何領域中尚未被證明的 Ran-Teng 假設，達成商用 AI 首次獨立產生原創數學證明的歷史性突破。

在歷經七次對話與四個版本的逐步演化下，AI 主導了探索路徑與構建證明架構。這項成果不僅反駁了 AI 只會重新排列組合訓練資料的偏見，也催生出名為「vibe proving」的全新 AI 推理研究法，顯示模型具備協助整理與探索複雜理論想法的能力。學者指出，隨著 AI 讓證明候選假設的速度大幅飆升，未來學術研究的瓶頸將從「如何證明」轉向「如何靠人類進行驗證與邏輯審查」。

https://technews.tw/2026/03/31/for-the-first-time-chatgpt-has-solved-an-unproven-math-problem-in-geometry/

2026/04/28

23 歲業餘數學家靠 ChatGPT 破解 60 年未解難題，陶哲軒：專家們第一步就走偏了

一名從未受過正規數學訓練的 23 歲業餘數學愛好者 Liam Price，利用 ChatGPT 成功破解了傳奇數學家保羅．艾狄胥留下的 60 年未解難題——關於「原始集合」的編號 #1196 猜想。

他採用了被稱為「vibe-math」的顛覆性方法，不從傳統數學的嚴格定式或證明出發，而是利用一個提示詞先讓 AI 自由發想，再由人類負責篩選與引導。菲爾茲獎得主陶哲軒在審視這項證明時指出，過去所有研究此問題的專家集體在第一步就走錯了方向。這次重大突破不僅揭示了學界長年陷入的思考慣性，也證明 AI 的創新思維在人類適當引導下，能讓非專業者跨越知識壁壘，徹底重塑現代高等數學的研究範式。

https://www.koc.com.tw/archives/640839

2026/05/11

數學專業，危！菲爾茲獎得主親測ChatGPT 5.5 Pro，17分鐘出論文級成果

菲爾茲獎得主 Timothy Gowers 測試最新 ChatGPT 5.5 Pro 的結果震撼數學界，該模型僅耗時兩小時便獨立攻克加法數論的公開難題，並產出博士論文等級的成果。這項突破引發高等數學教育地基動搖的危機，因為過去專供博士生練手、培養直覺的入門研究題目，如今已被人工智慧輕鬆解決。

面對 AI 帶來的衝擊，另一位菲爾茲獎得主陶哲軒提出了「金字塔模型」來重新定義人類價值。他認為 AI 雖能高效進行證明的生成與驗證，但人類數學家透過「咀嚼與消化」證明所經歷的自然難度與思考過程，才是不可被替代的核心，未來數學研究更應著重於此。

https://hao.cnyes.com/post/246802

2026/05/12

ChatGPT 5.5 Pro 1 小時解組合數學難題　專家：人類研究最低標準將改變

數學家 Timothy Gowers 親測 ChatGPT 5.5 Pro，在未提供任何數學指引下，AI 僅花 1 至 2 小時便解開涉及整數集合「和集合」大小的組合數學難題，產出足以作為博士論文章節的研究成果。

過程中，AI 針對基本情況將傳統的指數級別上界成功改善為二次多項式級別，更進一步在 MIT 學生現有研究基礎上完成延伸。該學生審閱後坦言，相同方向若由自己獨立研究需耗時 1 至 2 週，而 AI 不到 1 小時即搞定。這項突破令專家直言「人類研究最低門檻正在改變」，過去供博士生練手的未解決問題如今已被 AI 碾平，未來人類的挑戰將轉向如何與 AI 深度協作，去完成機器單獨無法攻克的研究。

https://unwire.hk/2026/05/12/chatgpt-5-5-pro-doctoral-math-research-one-hour/learning/

2026/05/20

OpenAI 模型推翻了離散幾何中的一個核心猜想

OpenAI 發表一項重大研究里程碑，旗下的通用推理模型自主推翻了離散幾何領域中懸而未決近 80 年的「平面單位距離猜想」。

該猜想由傳奇數學家保羅．艾狄胥（Paul Erdős）於 1946 年提出，過去主流學界普遍相信「方形網格」在最大化單位距離點對數量上已是最優解。然而，OpenAI 的新模型打破了這一長久以來的直覺，巧妙地將代數數論中極為深奧的工具（如無窮類域塔與 Golod–Shafarevich 理論）引入初等幾何問題，構造出超越方形網格極限的無窮例子族。

這項成果被菲爾茲獎得主 Timothy Gowers 譽為 AI 數學史上的里程碑。專家審查後指出，模型在思路鏈中展現出極強的建構傾向與獨特直覺，跳脫人類常規的證明框架，不僅是人類數學家的助手，更具備提出並實現原創妙想的深度推理能力。

https://openai.com/zh-Hant/index/model-disproves-discrete-geometry-conjecture/

2026/05/31

困擾學界80年數學難題 AI破解「平面單位距離猜想」

美國人工智慧公司 OpenAI 旗下的通用推理模型近日成功推翻傳奇數學家艾狄胥於1946年提出的「平面單位距離猜想」，一舉攻克困擾數學界長達80年的離散幾何核心難題。

過去學界普遍認為「正方形網格」是排列點陣並獲得最多單位距離點對的最佳解法。然而，AI 突破了傳統的網格思維，自主運用高階的「代數數論」，在平面上建構出一種全新的點陣排列方式，證明網格並非最優解。多位國際頂尖數學家，包括菲爾茲獎得主 Timothy Gowers 均驗證其推理有效，並盛讚這項獨立且高水準的科研成果，甚至坦言人類未來在解決數學問題上將很難與 AI 競爭。

https://www.stheadline.com/realtime-world/3577974/

環遊數界

AI與數學家正面交鋒，數學難題一一被突破？2026年歷程全紀錄

AI與數學家正面交鋒，數學難題一一被突破？2026年歷程全紀錄

2026/01/15

AI會取代數學家嗎？陶哲軒：工具進步，不等於思考被取代

2026/01/15

GPT-5.2 數學推理大躍進，15 分鐘解出埃爾德什問題

2026/02/06

4 道長期未解數學題被 AI 破解：新創 Axiom 如何把 AI 推向「可驗證推理」的新階段？

2026/02/14

情人節最硬核“Kiss”！中國AI突破300年親吻數難題，連刷多維度紀錄

2026/02/23

數學家設下研究級試金石，OpenAI挑戰First Proof

2026/03/31

ChatGPT 首次獨立證明數學假設！AI 除了 vibe coding 更進步到「vibe proving」

2026/04/28

23 歲業餘數學家靠 ChatGPT 破解 60 年未解難題，陶哲軒：專家們第一步就走偏了

2026/05/11

數學專業，危！菲爾茲獎得主親測ChatGPT 5.5 Pro，17分鐘出論文級成果

2026/05/12

ChatGPT 5.5 Pro 1 小時解組合數學難題　專家：人類研究最低標準將改變

2026/05/20

OpenAI 模型推翻了離散幾何中的一個核心猜想

2026/05/31

困擾學界80年數學難題 AI破解「平面單位距離猜想」

發表迴響取消回覆

AI與數學家正面交鋒，數學難題一一被突破？2026年歷程全紀錄

AI與數學家正面交鋒，數學難題一一被突破？2026年歷程全紀錄

2026/01/15

AI會取代數學家嗎？陶哲軒：工具進步，不等於思考被取代

2026/01/15

GPT-5.2 數學推理大躍進，15 分鐘解出埃爾德什問題

2026/02/06

4 道長期未解數學題被 AI 破解：新創 Axiom 如何把 AI 推向「可驗證推理」的新階段？

2026/02/14

情人節最硬核“Kiss”！中國AI突破300年親吻數難題，連刷多維度紀錄

2026/02/23

數學家設下研究級試金石，OpenAI挑戰First Proof

2026/03/31

ChatGPT 首次獨立證明數學假設！AI 除了 vibe coding 更進步到「vibe proving」

2026/04/28

23 歲業餘數學家靠 ChatGPT 破解 60 年未解難題，陶哲軒：專家們第一步就走偏了

2026/05/11

數學專業，危！菲爾茲獎得主親測ChatGPT 5.5 Pro，17分鐘出論文級成果

2026/05/12

ChatGPT 5.5 Pro 1 小時解組合數學難題 專家：人類研究最低標準將改變

2026/05/20

OpenAI 模型推翻了離散幾何中的一個核心猜想

2026/05/31

困擾學界80年數學難題 AI破解「平面單位距離猜想」

分享此文：

發表迴響取消回覆

ChatGPT 5.5 Pro 1 小時解組合數學難題　專家：人類研究最低標準將改變