mikeon88 2025-7-28 7:19
Ted桑,問一個大外行的問題
請教對底下新聞有何評論?謝謝
AI對新藥開發的幫助有這麼快嗎?
AI專家預測人類有望「這年」實現長生不老 活到500歲不是夢
| 星島頭條
入選《時代》雜誌「AI百大影響力人物」的科學家庫日韋爾(Ray Kurzweil)近日大膽預測,人工智能(AI)在2032年後就能讓人類停止老化,且未來AI與人類大腦連結後,可大幅增進人類智力、治癒大部分疾病,讓人類壽命延長至500歲。
ted_17 2025-7-29 11:38
非常歡迎Mike發起關於生醫研究與AI的主題!也歡迎大家來參與討論,更是歡迎巴班同學中的程式工程師來教導我們!我來拋磚引玉;我們公司也正在引進AI,因此我也有一些粗糙的想法。我的回覆會有四個部分:
1)總結文中庫日韋爾(Ray Kurzweil)對AI應用於生物醫學研究的看法;
2)簡述我對AI的理解,表明我對AI理解的侷限;
3)簡述目前我所觀察到的生物醫學研究現況,以及應用AI的成功例子;
4)最後,我個人對於AI 應用的看法與預測。當然這個部份會受限於我對於AI的理解。
1)文中庫氏對AI應用在生物醫學的看法
庫氏認為:AI會在2029年前跨越奇點,成功超越人腦智慧。一旦超越人智,將會對醫療研究有重大突破,導致大部分疾病被治癒,並且有可能有辦法延緩老化,甚至是逆轉老化,讓人回春延長壽命。
2)我對AI的理解
在我的認知中,AI或是LLM(大型語言模型),是一種用來分析數據之間相互關係的演算程式,而這個演算程式需要先用高品質的“已知資料庫(data set/data base)”來“訓練/校正”後,方才能投入實際應用。這個就像是人在網站上為Captcha 做測驗一樣:人正確分辨出哪一個圖片裡有車輛或是郵筒,來幫Captcha 建立已知資料庫。然後有使用Captcha 資料庫訓練過的AI 就可以去分辨新的圖片中有沒有車輛或是郵筒。換句話說,一個成功的LLM前提就是需要有優良的,正確的,已知資料庫來訓練/校正。
3)簡述目前生物醫學研究現況與成功AI應用案例
生物醫學實驗大致上分成兩類:製作大型資料庫一次檢視成千上萬個分子關係,或是使用經典實驗技巧檢視少量的分子關係。前者花大錢、省時間、但是精度較低,後者相對省錢、耗時、精度高。我們在這個討論裡將「分子關係」定義為「可成為<製藥標的>的生物現象」。
現在定序(sequencing or Omics,一種實驗技巧用來辨別各種不同分子與其數量,可檢驗DNA、 RNA、蛋白質、脂質等,在這裡中文用定序這個詞不太好,但是在這個主題下的討論,這個詞堪用)成本不斷降低,所以有許多實驗室正在使用定序來大量生產「同時檢驗多個分子關係的大型數據庫(-omics data set)」為了供LLM使用與訓練。但是這些大型的數據庫在執行層面上往往有諸多不盡完善的部分,所以會包含許多雜訊(垃圾)。這些雜訊會使LLM分析真正有意義的數據過程中產生許多困難,也會增加分析時間。根據我的同事(他的專業就是製作這些數據庫),現在公開的資料庫裡有價值的不到30%。這種製作資料庫的實驗,我們行內暱稱「用散彈槍打鳥」,經得起精密檢驗、嚴謹的、可重現的大型資料庫實驗相當稀少。所謂「吃垃圾,拉出來更是垃圾」( Garbage in, garbage out)。這些資料庫用了反而會浪費時間。
與大型資料庫相對應的實驗,就是運用細胞學、分子生物學還有生化學的經典實驗技巧來進行檢視少量分子關係。即便是這種仔細的實驗之中,已經出版的文獻裡面所描述的分子關係30-50%是經不起檢驗,也無法重現的。因此在我看來,目前生物研究成果雖然有優良的數據,但是其量遠遠不夠支撐使用AI來進行文中庫氏所描述的跳耀式製藥研發; 使用AI輔助研究,必須要有優質的資料庫。 更不用說我們對細胞的理解還遠遠不足,還有無數的生物問題目前沒有研究的方法,也還有數十年的研究等著被完成呢。
但是這也不是說並沒有AI 成功應用的實例。目前有一個非常耀眼的成功案例:AlphaFold1-3。這三代AI是用來預測蛋白質結構,其校正用的資料庫,是過去多年來用嚴謹的審核標準所彙整的蛋白質結晶數據。用這個資料庫所訓練出來的AlphaFold3,其預測的蛋白質結構非常準確。Alphafold3 已經加速了許多小分子藥的研發,節省了大量的研究時間。
4)我個人的看法
庫氏與黃仁勳的看法類似。他們是電腦科學家,相信只要AI的演算能力足夠了就可以充分的分析生物資料。這個思考邏輯是沒有錯的,我也認同奇點會在近期到來,唯一不足的地方是認為現代科學所累積的生物資料堪用。將生物資料轉變成電子資訊等同於類比轉成數位,只是簡單的通訊花了人類將近三十年的時間轉換成數位。將生物資訊完整的轉換成數位資訊是一項浩大的工程,如果完成了我認為可以變成世界第十一大奇觀。我認為庫氏對於目前生物醫學界資料庫的想法過於美好,那樣子跳躍的進展我不認為是近幾年可能發生的。
我覺得以下的情境比較有可能發生:
1 ) 近五年,生醫研究轉向於提供優質的實驗成果,並且將成果數位化。數位化程度與優質的資料庫開始增加後,AI便開始輔助實驗設計與管理實驗資料。這個生產優質實驗結果與數位化去年已經開始了,但是AI還未能輔助實驗設計與管理資料。使用AI輔助研究,必須要有優質的資料庫。
2 ) 近五到十年,AI輔助小範圍內的生醫領域突飛猛進,尤其是擁有優質資料庫的生醫領域。舉例:我認為抗體藥的研發會非常受益於AI的發展, 研發抗體藥有一大部分的時間是在研究抗體與蛋白質之間的相互作用還有結構變化。目前Alphafold3有能力準確地預測蛋白質結構,所以我相信在不久的將來類似的AI將有能力模擬計算蛋白質之間的相互作用還有結構變化。
在不久的將來,我想AI對於生物醫學研發最大的影響應該是會像這樣:某個製藥/疾病領域的優質資料庫累積到某一個臨界程度後,AI學習這個資料庫後便可開始輔助、甚至是主導研究。當<可以應用AI的生醫領域>數量突破某個臨界值時,也許生醫研究也就結束了。
最後,我來童心幻想一下:某年,AI在科學上有重大突破,發展出全新的X技術,也順便影響到了生物醫學。目前細胞生物,生物化學這類研究顯微生物機制的學科有許多無法研究的課題,因為缺乏觀測與干涉的科學技術。因為發明的X技術,所以生物醫學研究發現了全新的甲乙丙丁,這些甲乙丙丁加速了將細胞完整的數據化。這個之後就不描述了,因為完全是臆測,所以也不是不可能大家都因為AI而變成了武林高手,內功氣功輕功飛來飛去。
mikeon88 2025-7-29 12:53
是哩!我也覺得這兩年大家對AI的進展
神話了,有點誇大太過樂觀
說有了AI之後就不需要程式設計師
即令人存疑
就像一個完全不懂程式的人
用白話文把盈再表的規則講給AI聽
不懂程式的人描述起來痛苦
AI更會摸不著頭緒
這個狀況以前我在券商的時候就親眼看過了
電腦部的人一直問我們研究員
除權除息、減資、買回庫藏股的還原股價公式
這三種狀況同時合起來要怎麼設
研究員解釋得很痛苦
程式人員更是鴨子聽雷
AI對寫程式的幫助
應該比較像Excel的Macro
只要把一連串動作做一遍
Macro就會幫你轉成程式碼
這也只是一段的程式
要把它插進整個系統
仍然需要懂得寫程式的人才知道怎麼改
所以怎麼可能有了AI之後就不需要程式設計師
我說:「統計、寫程式、投資,我樣樣稀鬆略懂皮毛,卻恰好成為最適合發明盈再表的人,若分別找三個領域的專家在溝通困難下十倍時間也做不出來。」
我猜藥物開發也是一樣
AI只能幫生藥學家執行某一段的研究
可是每一段的研究要接起來
才有意義才能突破
這就需要生藥學家親力親為,AI無法取代
我們不可能下一句指令叫AI開發治療癌症的新藥
AI就幫我們全部包辦研發出來