〔摘要〕 20世紀被稱為分析哲學的世紀,它用邏輯方法對語言進行了邏輯分析并由此形成了分析哲學、語言哲學,實現了科學認知的語言轉向。然而,由于缺少可計算的方法工具,語言轉向遇到了種種困難。隨著大數據時代的來臨,數據成為比自然語言更加精準的科學語言,它比邏輯語言更加方便描述、建模、計算,分析哲學和語言哲學難以實現的學術愿景有可能由數據哲學來實現,從而帶來一場從語言到數據、從邏輯到算法、從分析到綜合、從證明到發現、從因果到相關的科學認知數據轉向。
〔關鍵詞〕 科學認知,語言轉向,數據轉向,數據哲學
〔中圖分類號〕N03 〔文獻標識碼〕A 〔文章編號〕1004-4175(2021)02-0032-08
20世紀的認知研究色彩紛呈、精彩不斷,各種流派輪番登場,但不少哲學家還是將其稱為“分析哲學時代”,并把語言轉向看作是20世紀認知研究特別是科學認知方向的重大轉變 〔1 〕5。由于數理邏輯的興起和應用,20世紀認知研究的語言轉向帶來了認知研究語言更加嚴謹、明確,更加符合邏輯規范,并因此開辟了分析哲學、語言哲學等認知研究新領域。但是,經過近一個世紀的發展,語言轉向并沒有實現當初的學術愿景,分析哲學家對形而上學語言的邏輯分析和邏輯重構難以進行,語言哲學家對自然語言的邏輯分析又讓自然語言支離破碎,因此20世紀的語言轉向雖然取得了不少成績,但最后基本上都以逐漸衰落而告終 〔2 〕20。
21世紀20年代,距離提出分析哲學和語言轉向整整100年,我們的時代已經進入了以互聯網、大數據、人工智能為代表的新一代信息革命時代。在這場信息革命中,數據化成了信息革命的重要手段,數據成為人們關注的熱點。21世紀的科學認知向何處去?是否會像20世紀初因為數理邏輯的興起而發生語言轉向一樣,科學認知即將發生數據轉向呢?科學認知如果發生數據轉向,它又將轉向何處呢?本文試圖在比對20世紀初發生的科學認知語言轉向的基礎上提出21世紀發生數據轉向的可能性、必要性,并從五個維度對數據轉向進行初步的探討。
一、20世紀認知研究的困境與語言轉向
20世紀初那場認知研究的語言轉向,現在仍然被哲學家們津津樂道。那次語言轉向是如何發生的?哲學家們為何突然關注上語言?哲學家們又如何來關注語言?語言轉向給20世紀的哲學帶來了什么樣的影響呢?我們將從20世紀初的哲學認知困境說起。
(一)20世紀初認知研究的困境
哲學具有兩千多年的悠久歷史,并取得了令人矚目的成就。然而,隨著近代科學的興起,科學技術取得了令人矚目的高速發展,連續發生了兩次科學革命并帶來了技術革命和產業革命。特別是19世紀末20世紀初的世紀轉折時期,作為自然科學代表的物理學同時發生了相對論、量子力學革命,并由此帶來了激動人心的現代科學時代。然而,作為傳統哲學的形而上學卻依然故我,邁著自身固有的蹣跚步伐。與生機勃勃、充滿活力的科學技術相比,古老的哲學顯得老態龍鐘。一些具有科學功底的哲學家們開始反思:數千年歷史的哲學為什么總是重復昨天的故事,不能像科學一樣邁開步伐快速前進呢?哲學為什么會沒有多少進步呢?這些問題久久地困擾著20世紀初的哲學家們 〔3 〕1-2。
哲學家們發現,自古希臘開始,數學、力學雖然與哲學不分家,但它們更注重邏輯的力量。例如歐幾里得幾何學就是從五個公理出發一步步進行邏輯推演而形成整個幾何學體系,阿基米德的浮力定律則通過觀察和實驗,再進行一步步的邏輯推演。自文藝復興之后,以天文學、力學為代表的自然科學更是逐漸擺脫了傳統形而上學的純思辨方法,走向觀察、實驗和數學描述,特別是每一門學科都會對其基本概念的含義進行預先的約定,并對其基本假設進行符號化、公理化然后進行嚴密的邏輯推演。例如偉大的科學家牛頓就是將觀察數據和數學方法有機結合,在數據、符號的基礎上建構嚴密的學科邏輯體系。所以,自然科學可以在前人的基礎上不斷前進,無需回頭。與此相反,哲學家們則一直用日常生活的自然語言來表達自己的復雜思想,而且很少進行約定和規范,更不用實驗、數據、符號和數學,僅僅憑著日常語言來闡述自己高深的理論。因此,每一個人都可以對他的思想進行不同的理解和解釋,從而產生諸多的分歧。更為重要的是,自然科學數據化、符號化和邏輯化的科學語言在傳遞過程中不容易產生信息失真,而哲學家所用的自然語言則失真嚴重,經過幾個人的轉述就可能變得面目全非,所以哲學家要不斷地回到最原始的哲學文本,而科學家則可以勇往直前而無需擔心信息在傳遞中的失真問題。
哲學家們發現,古代哲學把中心放在探索“世界是什么”的本體論問題有點大而無當,因為缺少認識工具的支持,我們很難說清楚世界究竟是什么,因此近代哲學發生了認識論轉向這一重大的哲學方向的轉變,近代哲學的研究重點轉向了認識論。哲學轉向認識論之后,人類對自身如何認識世界、認識自己有了更深刻的反思,認識論也有了許許多多的理論和學派,但與自然科學的快速進步相比,哲學仍然進步不大。就認識論來說,認識論雖然比本體論更抓住了問題的本質,但人類認識世界必然要有合適的認識工具,其中無論是認識世界的理論工具還是認識世界的理論成果都需要有合適的表述工具,這樣才能夠更好地描述認識的成果。自然科學找到了自己的科學語言工具,而哲學卻缺乏自己獨特的表述工具因而只能用多義的自然語言。因此,20世紀初的哲學家們終于找到了哲學停步不前的問題癥結是語言工具問題,而數理邏輯的興起為哲學家們解決語言工具問題帶來了曙光。
(二)數理邏輯的興起與分析哲學運動
19世紀末20世紀初,除了轟轟烈烈的物理學革命之外,數學界和邏輯學界也發生了一場類似的革命,即數理邏輯的興起。19世紀末,數學家們都在尋找數學的基礎問題,也就是說,數學學科到19世紀末已經取得了巨大成就,但龐大的數學大廈卻一直沒有找到自己的學科基礎。龐大的數學大廈究竟建構在什么基礎之上呢?這關涉到數學大廈是否牢固并且能否繼續往上添磚加瓦的問題。與此同時,邏輯學家發現,邏輯學從古希臘的亞里士多德開始經歷了兩千多年,卻一直停留在用自然語言表述的三段論上。邏輯學是否也可以像數學和自然科學一樣實現符號化?這是邏輯學家開始思考的問題。數學家弗雷格發現,數學學科的基礎問題最終是邏輯問題,但傳統的自然語言表述的邏輯無法表達以形式化為標志的數學問題,于是弗雷格將數學的形式化方法應用于傳統邏輯的改造中,即把自然語言表述的邏輯進行形式化、符號化,創造了完全符號化的數理邏輯。數理邏輯的創建具有極其重要的意義,一方面讓語言邏輯變成了符號邏輯,實現了邏輯的符號化,另一方面解決了數學學科的基礎問題,即把數學的基礎問題轉換成了數理邏輯問題,例如數學家、哲學家羅素與懷德海一起出版的《數學原理》就是試圖把整個數學王國建構在數理邏輯的基礎上。20世紀初,數理邏輯成了數學和邏輯學兩個學科的研究熱點,它讓兩千多年沒有根本變化的亞里斯多德邏輯學發生了革命性變革。
數理邏輯的興起,讓哲學家們發現了近代科學快速發展的秘密,即近代科學之所以能夠突飛猛進,就是因為科學家們完全遵循了符號化、邏輯化的方法,使用的是結構化語言,從而把科學思想表述得清楚、明白,在傳播過程中不會發生思想信息的失真、衰變。哲學之所以發展緩慢,而且要不斷回到原點,就是因為沒有能夠保真的思想傳遞工具。于是,近代哲學從重點關注認識論,再次轉向關注語言問題,因為任何哲學思想的表達都離不開語言,即沒有語言,任何哲學思想都無法得到表述,更不可能得到傳遞。最初,羅素、維特根斯坦和邏輯經驗主義的哲學家們試圖用數理邏輯構造一種完全形式化、符號化的人工語言,即數理邏輯語言來改造哲學家們使用了數千年的自然語言。邏輯經驗主義甚至提出讓物理學家來當語文老師的主張,因為傳統的語文老師不懂自然科學、不懂數理邏輯,教出的都是說話朦朧、充滿詩意的學生??柤{普更是用數理邏輯來推演整個世界,提出世界的邏輯構造思想。這個階段的哲學家們雖然關注語言,認識到語言的極端重要性,但他們更希望徹底改造自然語言,讓所有哲學家甚至所有人都用清晰、明確、可推演的數理邏輯語言,并且把所有復雜的事物、思想分解為清楚明白、沒有歧義的簡單命題,因此這個時期的哲學被稱為分析哲學。分析哲學沒有統一的學派標準,但他們具有家族相似性,即他們都以語言為對象,邏輯為工具,分析為手段 〔3 〕8-9。作為一場哲學運動,分析哲學從20世紀20年代開始影響了世界認知研究數十年,至今依然有其聲音。
(三)20世紀認知研究的語言轉向
20世紀50年代前后,分析哲學遇到了各種問題,難以實現世界的邏輯重構目標,于是在英國興起了日常語言學派,他們開始用數理邏輯方法來分析日常語言,以便讓哲學家和大眾在使用日常語言的過程中能夠更加遵循邏輯規范。更為重要的是,哲學家們開始更加關注語言,用邏輯、分析的方法來精細地分析詞匯、語句、語法等,以便讓哲學家們和大眾能夠把事物和思想表述得更加清楚明白,更能夠進行推理、分析。牛津日常語言學派正是這個時期的代表,隨后發展為具有較大影響的語言哲學學派,而且從此語言哲學成為認知研究,特別是英美認知研究的重點 〔4 〕125。
分析哲學的興起和語言哲學的發展意味著語言成為認知研究的核心,也就是說從古希臘哲學關注世界的本體到近代哲學關注認識之后,哲學再一次發生了研究重點的革命性轉變,前者被稱為認識轉向,而后者被稱為語言轉向。語言轉向從什么時候開始的呢?有人說發生在20世紀20年代分析哲學興起之時,也有人說是發生在20世紀60年代語言哲學興起之時,更有學者認為發生在弗雷格創建數理邏輯之時或維特根斯坦出版其《邏輯哲學論》之時 〔4 〕14-16。不過雖然具體時間難以統一,但從弗雷格開始,語言就進入了哲學關注的視野,因為認識論必然需要語言來描述對象、分析問題、預測未來,語言轉向是認識轉向的細化和實現。語言轉向的特征表現為語言成為哲學的重點關注對象,邏輯成為重要的描述方法,而分析成了重要的徑路。語言轉向的結果帶來了20世紀的分析哲學運動和語言哲學的誕生。邏輯、語言、分析成為20世紀哲學最重要的三個關鍵詞。
二、21世紀認知研究的困境與數據哲學的興起
21世紀,作為時代精神精華的哲學,在新時代該有怎樣的變革呢?是繼續20世紀的分析哲學和語言哲學之路,還是該有自己的方向性轉變呢?21世紀初是否又出現了類似20世紀初的時代背景和認知轉向的可能性?如果即將轉向,又將轉向何處?為此,我們先從21世紀初認知研究的困境和大數據時代的來臨開始。
(一)認知研究的新時代困境
20世紀初哲學的語言轉向與分析哲學、語言哲學的興起,雖然當初雄心勃勃,而且產生了巨大的影響,但最后并沒有實現他們的初心。分析哲學開始于20世紀初,強盛于20-40年代,后來很快發現哲學語言和日常語言并不能完全被人工構造的數理邏輯語言所取代,因此當初邏輯經驗主義所主張的“讓物理老師教語文”并不現實。也就是說,人們在日常生活中以及在認知研究中都不可能放棄具有數千年歷史的自然語言而改用完全符號化的數理邏輯語言。
20世紀50年代后,哲學家們不再用數理邏輯來改造自然語言,而是對自然語言進行邏輯分析,以幫助自然語言更加正確、精準。也就是說,不再用數理邏輯對自然語言進行全面的符號化和邏輯推理,而是在尊重自然語言的基礎上進行邏輯分解和分析,以便找到自然語言的規律,并對其作適當的規范性改造,由此語言轉向進入語言哲學研究。語言哲學的本質是將自然語言映射為邏輯語言,從而通過對邏輯語言的分析來研究自然語言的規律。語言哲學雖然對語言的規范性、精準性作出了重要貢獻,但同時也把自然語言弄得支離破碎,以至于讓人感覺自然語言不再自然。20世紀80年代開始,語言哲學開始走上了下坡路,當初的學術愿景也沒有徹底實現 〔3 〕5。
由此可見,20世紀以分哲學與語言哲學為代表的語言轉向雖然在20世紀影響巨大,曾經被稱為“哲學中的革命”,但這次語言轉向沒有取得預期的成功,并在20世紀就已經走向衰落,認知研究再一次失去了重大方向的引領。因此,分析哲學、語言哲學不可能是21世紀認知研究的主流,21世紀的哲學必須在跟隨其時代的發展再次開啟新的轉向。
(二)數據革命與大數據時代的來臨
自從文藝復興以來科學技術逐漸成為引領時代發展的方向標和推動力,20世紀認知研究的語言轉向也是由于當時數理邏輯的興起而引發的。21世紀初的20年,科學技術發生了什么重大變革呢?20世紀到21世紀的世紀之交,沒有發生19世紀到20世紀的世紀之交那激動人心的科學革命,但在技術上卻比上個世紀之交還更加激動人心。生物技術、量子技術、網絡技術、智能技術等一系列技術都正在發生著革命。有人用不同的名稱來描述新世紀這場革命,但這一切革命都建立在數據革命的基礎上,因此用數據革命來概括可能更加合適。
20世紀中葉開始的信息革命為21世紀的數據革命做好了充分的準備,所以這場數據革命也被稱為新一代信息革命。二戰結束后的信息論和電子數字計算機分別從科學和技術兩個方面邁開了信息革命的步伐。信息論的創立讓以往難以認知的信息進入了科學研究的視野,而數字電子計算機的發明更是將信息徹底表征為機器能夠處理的0和1兩個符號的數據集合,實現了數據的機器自動處理。隨后的感知技術、網絡技術、存儲技術和智能技術等一系列的技術創新為數據采集、存儲、傳輸和處理的革命性變革。進入21世紀后,移動互聯網、智能手機、物聯網、網絡社交等一系列新技術更是讓數據規模迅速飆升,于是帶來了前所未有的大數據時代。
(三)數據成為新時代關注的熱點
大數據是21世紀一系列新技術革命的結果,同時又是引發一系列新技術革命的動因。在大數據時代,數據無疑成了這個時代的標志和主角,因此也就成了一系列學科關注的熱點。數據在過去主要是指由數字和計量單位一起構成的對事物的量化描述,在人類對世界的量化認識中起著重要的作用,因此人們對其并不陌生。為什么它就成了21世紀關注的新熱點呢?
首先,隨著數字化技術的發展,數據的規模發生了重大變化。過去的數據主要依靠人工采集,但上世紀中葉電子技術的發展特別是計算機技術的發展,帶來了數據采集、存儲、傳輸和計算方式的重大變化,由此出現了數據“爆炸”并帶來了大數據時代 〔5 〕9-10。21世紀開始,數據成了一種新資源,一種新現象。無論是互聯網、物聯網、人工智能還是區塊鏈,幾乎所有的新技術都建立在大數據的基礎上,數據成了刻畫世界和認識世界的新手段。
其次,隨著數字化技術的發展,數據的性質發生了重大變化。信息論和控制論創始人維納認為,世界由質料、能量和信息三要素構成,由此他和申農同時提出了信息論。信息的本質是對世界狀態的映射或刻畫,但過去我們卻很難找到合適的信息表征方式。隨著大數據時代的來臨,人們發現世界的一切皆可數據化,即“萬物皆數據” 〔5 〕123-126。過去對世界的描述分為定性和定量兩種描述方式,而且這兩種描述方式難以通約。大數據技術的發展讓定性描述可以轉化為定量描述,一切皆可量化,皆可由0和1兩個符號表征并被計算機處理。
最后,隨著數據化技術的發展,數據的地位發生了重大變化。人類認知世界其實就是通過感知世界的信息,通過信息的辨識來達到認知世界的狀態,因此需要合適的工具和技術來表述人類對世界的認識過程和結果。語言、文字、邏輯符號等都是表述人類認知的重要工具。數據作為人類認知的工具,在以往只是其他認知工具的補充,特別是作為定量描述為定性描述作補充。但是,隨著數字化技術的發展,萬物皆可被數據化,萬物皆可用數據來表述,這樣,我們的語言、文字、聲音、圖像、符號等,一切都可以用數據來表征,一切都可還原為數據。于是,數據成為信息的最重要的表征工具,而且是一種通用的表達工具,即使是以往定性的表述也一樣可以被數據化。所以,英國學者舍恩伯格說:“世界的本質就是數據” 〔5 〕125,而詹姆斯·格雷克也表達了同樣的意思:“萬物皆比特?!?〔6 〕7這樣,數據就從描述世界的工具逐漸成為世界的本質,數據在21世紀的地位有了本質的變化。
(四)數據哲學研究的興起
數據被哲學家關注,最早應該追溯到畢達哥拉斯,他在兩千多年前就提出了“數是萬物的本原”的觀點??上Ы酉聛淼膬汕Ф嗄?,哲學家們似乎都遺忘了對數據的關注,雖然期間也有萊布尼茲這樣的哲學家曾經對數據有所思考,但終究沒有形成系統的數據哲學。
直到20世紀80年代,隨著數字化技術和計算機技術的發展,數據的地位更加凸顯之后,哲學家波根(J.Bogen)和伍德沃德(J.Woodward)才將目光投向數據,把數據作為描述現象的工具并奠定科學發現的基礎,提出“數據—現象—理論”的科學發現模式 〔7 〕。計算機科學家吉姆·格雷則提出了基于海量數據的數據密集型科學發現新范式。2008年9月國際哲學界在德國海德堡召開了“數據·現象·理論”的國際研討會,并于2011年在《綜合》(Synthese)雜志上以專輯的形式發表了這次會議的26篇會議論文,由此哲學界開始將數據列入自己的研究議程中。
隨著大數據時代的來臨,國內外哲學界開始將目光轉向了大數據的哲學研究。在國外,英國大數據專家舍恩伯格在其暢銷書《大數據時代》中以通俗的語言開始了本體論、認識論、方法論和倫理學的一系列哲學思考,隨后國外哲學界展開了對大數據的哲學研究。在國內,大數據一被提出,就有李德偉、劉紅等學者開展了大數據的哲學研究。隨后,黃欣榮、段偉文等一批中國學者對大數據的本體論、認識論、方法論和倫理學進行了全面深入的研究,特別是大數據倫理的研究更加熱門和深入,由此大數據哲學成為科學技術哲學的重要研究方向。由此可見,目前國內外都有人提出了數據哲學的概念,國內是以數據哲學作為碩士論文或博士論文的選題,而國外則由哲學界之外的其他人提出了數據哲學的概念和設想。我們可以說,數據哲學研究正在開始興起。
三、21世紀科學認知的數據轉向
隨著大數據革命的展開和大數據時代的來臨,以及大數據哲學研究的深入和數據哲學的興起,數據不但成了21世紀最為重要的資源,而且成了最為重要的認知工具。數據正在成為21世紀哲學研究的新對象,數據哲學正在成為哲學研究的新領域。由此我們發現,21世紀20年代的科學認知又像20世紀20年代的科學認知一樣正面臨著變革和轉向重大機遇,即由上世紀的語言轉向走向21世紀的數據轉向。
20世紀的語言轉向是以語言為對象,以邏輯為工具,以分析為方法的一次認知研究方向的重大轉變。語言轉向的重要表現有三個方面:從認知對象上來說,從研究世界到研究語言;從認知工具來說,從形式邏輯到數理邏輯;從認知方法來說,從思辨方法到分析方法。那么這次的數據轉向會有什么樣的表現呢?與上次的轉向相類似,這次的數據轉向主要表現為如下五個方面:從認知對象來說,將從語言轉向數據;從認知工具來說,將從邏輯轉向算法;從認知方法來說,將從分析轉向綜合;從認知目標來說,將從知識證明轉向知識發現;從認知結果來看,將從追求因果轉向追求相關。我們將從這五個方面來分析數據轉向的重要表現,并從中可以看出數據轉向是否可能。
(一)認知對象:從語言轉向數據
作為愛智慧的哲學,曾經是科學及其他各種學科的母親,但自文藝復興以來,科學逐漸掙脫哲學母親的懷抱,走上了一條高速發展的道路,于是科學反而成為了哲學學習的榜樣。古代哲學代替科學直接探討世界的構成、運作原理等,但它使用的是思辨方法,因此難于揭示世界的本質或規律。近代哲學家認識到,要知道世界是什么首先必須解決我們是怎樣認識世界的,因此發生了認知研究的第一次大轉向,即認識論轉向。但科學的高速發展又啟發哲學,要認識世界,首先必須解決認識工具問題,這樣人類的認識才不會失真,于是哲學家們意識到必須研究語言問題,于是上世紀初又出現了語言轉向問題。語言轉向之后,哲學家們才發現,語言才是我們最需要研究的對象。但是,哲學有著自己的偉大使命和復雜理論,僅僅使用多義、多變的自然語言,許多問題都將在討論中失真、變味,因此分析哲學、邏輯實證主義才想使用科學中已經取得重大成就的符號化數理邏輯語言。但后來的實踐證明,邏輯化的道路是走不通的,于是回到自然語言的邏輯分析,并由此對自然語言進行邏輯規范。
認知研究的數據轉向事實上仍然是語言轉向的繼續,但它從研究自然語言或邏輯語言轉向為數據語言。以往哲學對世界的認知主要通過日常語言,但日常語言模糊、隨意,表述能力有限,而且很難完全映射為邏輯語言。但大數據時代的數據語言則有自己的特點:精準、全面、多樣、可算。所謂精準是指一切皆用0和1兩個符號序列來表征,沒有隨意性;所謂全面是指數據語言的表現力更強,除了表述自然語言之外,它還可以表征語音、圖像以及萬物的其他各種狀態;多樣是指無論是定性還是定量、無論是結構化還是非結構化的語言,一切都可以轉換成統一的數據語言;所謂可算是指數據語言可以輸入智能計算設備,可建??捎嬎?,實現數據處理自動化智能化。此外,數據語言在數據采集、存儲、傳輸和應用等方面都比自然語言或邏輯語言更加方便快捷,并可實現智能化。
科學認知的語言轉向只學到了科學超常發展經驗的一個方面,科學的確首先要把認識結果用語言表述清楚,必須符合邏輯規律,這樣才能確保認識結果客觀真實,不至于在傳遞過程中失真變異,也才能保證從正確的前提推演出正確的結論,這就是構造性語言或結構化語言。但是,近現代科學之所以超常發展,還有一個重要秘密,那就是用數據說話,即數據化。無論是開普勒、伽利略還是牛頓,都是通過觀測數據或受控實驗獲取數據之后,用數據來描述現象、尋找規律并預測未來的,所以數據在科學的快速發展中起了巨大的作用。邏輯表述和觀察數據是科學發展的兩條腿。語言轉向,哲學家們發現了科學發展的一條腿,而數據轉向則又發現了另一條腿。認知研究的語言轉向到數據轉向,都在試圖找到科學這個榜樣的發展秘密,并從用語言說話,到用邏輯說話再到用數據說話,人類認識的語言越來越嚴謹,越來越精準,從而越來越科學。
(二)認知工具:從邏輯轉向算法
無論是科學認識還是哲學認識,除了需要合適的語言之外,還需要科學的工具。哲學的語言轉向讓哲學的重點放到了語言上,而且開始主要還是自然語言。從亞里士多德開始,人們說話就被要求符合邏輯,不能出現邏輯矛盾。因此,當我們試圖從自然語言中找到規律時,邏輯就成了最佳科學工具。在語言轉向之前,哲學家們也只能用形式邏輯對日常語言進行邏輯分析。因為缺乏必要的符號化,這種傳統邏輯分析比較繁瑣,而且難于實現符號化。正是19世紀末20世紀初數理邏輯的興起為日常語言進行符號化的數理邏輯分析成為可能,也為日常語言的符號化和邏輯化提供了工具。
符號化的數理邏輯消除了自然語言的不確定性,帶來了邏輯語言的確定性,而且具有更強的邏輯運算和推理能力。但是邏輯語言在一定程度上會改變自然語言,而且太強制太僵硬,難以對自然語言全面邏輯化。此外,對事物的邏輯描述特別麻煩,而且無法進行更加深入的各種計算操作,從而限制了邏輯語言的更廣泛應用。
數據轉向之后,數據成為關注的重點。對數據特別是大數據時代的海量數據如何進行分析?我們不可能再進行數理邏輯分析,必須使用新的科學工具,即算法分析。在大數據時代,對數據語言的算法分析將取代自然語言的邏輯分析,因此算法分析將成為數據轉向之后認知研究的重要科學工具。從21世紀開始,各種智能設備的廣泛應用帶來了數據的爆炸性增長,面對這海量的數據,不可能對每個數據找到因果性,就像分子物理學無法對海量的分子做全面的因果性分析一樣,我們只能找到海量數據所呈現出來的相關性,然后從相關性中發現一定的規律,并建立反映相關性的算法模型。
數理邏輯的興起為哲學的語言轉向準備了科學的分析工具,而數據算法的興起則為哲學的數據轉向準備了科學的分析工具。數據算法將成為數據分析最重要的科學工具,為我們從海量的數據中發現新知識、新規律提供了可能。
(三)認知方法:從分析轉向綜合
分析和綜合是人類認識事物的兩種基本方法。所謂分析就是將復雜的事物分解為簡單的事物,將整體的事物分解為其構成部分或構成要素。正是通過這種分解,可以實現化繁為簡,化整為零。所謂綜合方法則與分析正好相反,它把零碎的、部分的要素按事物內在的規律有機地統一為一個整體,從而達到從整體的視野看問題的目的。
20世紀被稱為分析的世紀,分析方法與語言轉向被當作20世紀哲學的基本特征。20世紀認知研究實現語言轉向之后,分析方法成為最重要的科學方法,可以說分析方法是實現語言轉向的重要方法。正因如此,分析哲學成了20世紀的哲學主流。
雖然把復雜事物分解為部分、要素有利于我們更好地認識事物,但這種分解也有可能破壞事物的整體性和有機性。被分解為海量的碎片之后,我們怎樣從中找到規律?我們如何重新組合為整體?特別是數據化技術把萬物分解為海量的數據之后,分解、分析不再是問題,如何重新整合起來成了我們這個時代的重要任務。所以認知研究實現數據轉向之后,其科學方法也將會發生重大轉向,即從側重于分析走向側重于綜合。從大數據的海量數據碎片中重新組裝、復合為事物的整體是數據哲學的重點,從而也將是我們這個大數據時代的特色。如果說20世紀可稱為分析的時代,那么我們也許可以將21世紀稱為綜合的時代,綜合將成為21世紀的主旋律和主要認知方法特征。
(四)認知目標:從證明轉向發現
知識發現和知識證明是人類認識的兩個重要階段,也是認識論的兩個重要任務。知識發現解決知識的來源問題,是知識的發生和起源問題,即知識從“無”到“有”的問題。知識證明主要是解決知識的可靠性問題,即如何證明我們發現的知識是值得信任的,而且可以將這種信任傳遞下去,即知識從“有”到“有”的問題。
分析哲學和語言哲學都借助邏輯演繹來證明知識的可靠性,讓我們已有的知識不至于在傳遞過程中由于信息失真而變得不可靠。正因如此,邏輯實證主義就利用演繹邏輯的必然性進行一步步推導,試圖從可靠的邏輯基點出發推演出整個知識大廈。例如羅素和懷德海合作的《數學原理》就試圖從可靠的數學公理出發利用演繹邏輯來建構出整個可靠的數學大廈。所以論證、證明、推演在分析哲學中占有絕對的地位,邏輯演繹成了語言轉向后的主要方法,而知識證明成了分析哲學和語言哲學的主要目標。
但是,推理、證明無法發現新知識,而新知識的發現還得靠歸納、綜合。數據哲學就是通過數據挖掘和數據算法,從海量數據中歸納、綜合提煉出具有規律性的知識,它善于發現新知識。正因如此,數據挖掘最初就被命名為知識發現。由于歸納出來的知識沒有絕對的可靠性,所以英國哲學家波普爾曾經極力反對歸納法,甚至揚言要把歸納法徹底趕走。但是,沒有歸納,人類就不可能發現知識,最后只能像波普爾所說的靠猜想來亂猜測。21世紀數據轉向之后的數據哲學將致力于從海量數據中發現各種各樣的有用知識。雖然不一定具有絕對可靠性,但它具有實用性。人工智能最初就是利用邏輯演繹來實現了幾何定理的機器證明,但由于邏輯演繹不能發現新知識,所以人工智能后來走向衰落。當前新一代人工智能就是利用大數據進行機器學習和知識發現,因此新一代人工智能才越來越聰明,顯現出其勃勃生機。因此,21世紀,人類的認知目標將從知識證明轉向知識發現,知識發現將是數據轉向之后哲學關注的重點。
(五)認知結果:從因果轉向相關
因果和相關是刻畫兩個事物之間關系的范疇,因果關系是具有必然性的關系,而相關性則指兩者之間具有一定的關聯,但未必具有必然的聯系。因果性提供了絕對的可靠性,而相關性則不完全可靠,我們只能將信將疑。傳統的認識論追求的就是這樣確定無疑的因果性,認為知識的大廈就必須由具有因果性的各種知識來建構,這樣才能值得相信。
分析哲學和語言哲學都希望借助于20世紀初剛剛興起的數理邏輯來建立具有因果關系的嚴密知識體系,甚至能夠像歐幾里得幾何學一樣從公理出發,經過嚴密的因果關系來建立知識體系。例如邏輯實證主義代表魯道夫·卡爾納普就用嚴密的數理邏輯來重構世界,撰寫了影響巨大的《世界的邏輯構造》。因果性是傳統科學的基石,更是20世紀分析哲學的靈魂,因為分析哲學是建立在數理邏輯的基礎上,而一切邏輯分析都是基于因果關系的。
大數據技術革命打破了因果性神話和因果性的終極追求。大數據認為“知道‘是什么’就夠了,沒必要知道‘為什么’。在大數據時代,我們不必非得知道現象背后的原因,而是要讓數據自己‘發聲’” 〔5 〕67。相關關系通過識別有用的關聯物來幫助我們分析現象,而不是通過揭示其內部的運作機制。通過海量數據和相關關系,人工智能可以實現快速的自我學習,發現相關性的規律,并對未來行為做出精準預測。由于數據的暴增,我們不可能找到每一個數據之間的因果關系,只能找到宏觀的相關關系,而且只要有了相關關系就能夠解決許多問題。因此,在大數據時代,我們不再偏執于追求因果關系,我們更重視的是數據之間的相關關系,相關性重于因果性。認知研究在數據轉向之后,其認知結果的追求也將從追求因果性轉向追求相關性。
總之,20世紀初數理邏輯的興起引發了哲學的語言轉向,興起了影響整個20世紀的分析哲學運動,并帶來了新的語言哲學。21世紀初,以互聯網、大數據、人工智能等一系列新技術的出現帶來了一場新一代信息技術革命,這場革命的核心是數據,數據語言成為世界流行的人機通用語言,“讓數據說話”成了21世紀的流行語。數據革命帶來了比自然語言、邏輯語言更精準、更豐富、可建模、可計算的數據語言,由此可能引發一場新的科學認知方向的大轉變,即數據轉向。數據轉向是語言轉向的再革命、再轉向,同時也是其延續和發展,即對語言轉向的克服和拓展。認知研究的數據轉向將可能像上世紀的語言轉向一樣,即將掀起一場哲學的綜合運動,并建構出內容更加豐富的數據哲學。21世紀哲學與20世紀哲學具有驚人的歷史相似性,我們可能即將迎來科學認知的數據轉向與數據哲學的興起。
參考文獻:
〔1〕M.懷特:分析的時代〔M〕.杜任之,譯.北京:商務印書館,1981.
〔2〕陳 波,江 怡.分析哲學——回顧與反?。ㄉ暇恚睠〕.北京:中國人民大學出版社,2018.
〔3〕江 怡.分析哲學教程〔M〕.北京:北京大學出版社,2009.
〔4〕王 路.走向分析哲學〔M〕.北京:中國人民大學出版社,2009.
〔5〕維克多·邁爾-舍恩伯格,肯尼斯·庫克耶.大數據時代〔M〕.盛楊燕,周濤,譯.杭州:浙江人民出版社,2013.
〔6〕詹姆斯·格雷克.信息簡史〔M〕.高博,譯.北京:人民郵電出版社,2013.
〔7〕Bogen J,Woodward J.Saving the phenomenal〔J〕.The Philosophical Review:303-352.
責任編輯 蘇玉娟