向日葵视频官网下载_向日葵视频色板_向日葵视频黄版_向日葵APP下载安装

新聞動態(tài)

聯(lián)系我們

咨詢:010-63396898
電話:010-63396881
地址:北京市 東城區(qū) 建國門北大街 金成建國5號
行業(yè)新聞
您當(dāng)前位置: 首頁 > 新聞動態(tài)

用“數(shù)字眼”透視歷史與未來

發(fā)布日期:2016-02-04 點(diǎn)擊:1124


  • 發(fā)布日期:2016-02-03
  • 作者:未知
  • 來源:大數(shù)據(jù)文摘

      數(shù)據(jù)在科學(xué)研究中的作用日益顯著

      在人文社會科學(xué)領(lǐng)域,以“人文計(jì)算”、復(fù)雜網(wǎng)絡(luò)分析、規(guī)模數(shù)據(jù)分析為特征的研究方法逐漸被采納,人文社會科學(xué)的“科學(xué)性”顯著增強(qiáng)??茖W(xué)家們正在用“數(shù)字眼”透視人類的歷史和未來。

      “數(shù)字眼”逾越自然科學(xué)和人文科學(xué)的鴻溝

      作為科學(xué)體系的兩大支柱,人文科學(xué)和自然科學(xué)自誕生開始就按照截然不同的范式幾乎平行地發(fā)展。人文科學(xué)主要以人類社會為研究對象,探索和揭示人類社會的本質(zhì)和發(fā)展規(guī)律;自然科學(xué)則以自然界為研究對象,解釋自然現(xiàn)象和揭示其客觀規(guī)律。二者就像兩個背對背的鏡子,形影相隨卻因研究手段的差異長期疏遠(yuǎn),科研人員也因此分為兩大陣營。幾年來,大數(shù)據(jù)在認(rèn)識人類語言、歷史、名望、記憶和文化等方面發(fā)揮了透鏡的作用。在宏大的人文視角下,“數(shù)字眼”通過冰冷的數(shù)據(jù)將人類文化“鮮活”地呈現(xiàn)在世人面前。

      在記錄文化的方式上,古今最大的差異就在于今天的大數(shù)據(jù)是以數(shù)字形式存在的。就像光學(xué)透鏡能轉(zhuǎn)換和操縱光線一樣,數(shù)字媒體也能轉(zhuǎn)換和操縱信息。只要擁有充足的數(shù)字記錄和一定程度的計(jì)算能力,人類文化的相關(guān)研究也會達(dá)到新的制高點(diǎn),我們也就有可能在認(rèn)識世界以及理解我們在世界中的地位方面做出令人驚嘆的貢獻(xiàn)。

      拉里?佩奇的“初戀”與數(shù)字眼

      2004年,谷歌“組織全世界信息”的使命進(jìn)展的很順利,這也使得谷歌的創(chuàng)始人拉里·佩奇(Larry Page)有暇回顧他的“初戀”——數(shù)字圖書館。9年之后,谷歌完成了3000萬本圖書的數(shù)字化,相當(dāng)于人類歷史上出版圖書總數(shù)的1/4,某些圖書甚至可以追溯到幾個世紀(jì)前。因此,這些數(shù)據(jù)不僅“大”,而且“長”。這些數(shù)字化的圖書不局限于描繪當(dāng)代人文圖景,還反映了人類文明在相當(dāng)長的時(shí)期內(nèi)的變遷,其時(shí)間跨度比一個人的生命還長,甚至超過了一個國家的壽命。兩位年輕人利用他們的數(shù)字眼——n元詞組詞頻查看器(N-gram Viewer),在量化歷史變遷和未來發(fā)展方面進(jìn)行了探索。他們創(chuàng)建了一個數(shù)據(jù)投影集合,為書中出現(xiàn)的每個英語單詞和每條短語單獨(dú)建立一條記錄,在計(jì)算機(jī)科學(xué)中這些單詞和短語有一個優(yōu)雅的名字:n元詞組(n-gram)。每個單詞和每條短語所對應(yīng)的記錄都是一個長長的數(shù)字列表,列表中的數(shù)字表示該n元詞組在書中出現(xiàn)的次數(shù),逐年排列,可以以量化的方式揭示人類的歷史和未來,這種數(shù)據(jù)投影的方式不僅非常有趣,而且在法律上也很安全(出版社不會因?yàn)槟闶褂昧四潮緯淖帜概判虬娑馗婺悖?/span>

      下面就和大家一起分享通過“數(shù)字眼”洞察的歷史和未來:

      如何獲得名望:職業(yè)選擇指南

      有些人可能還很年輕,還沒決定好自己將來想要成為什么樣的人,從事什么樣的職業(yè)。而職業(yè)選擇的最大挑戰(zhàn)就是缺少能夠提供參考的可靠數(shù)據(jù)。在一定程度上數(shù)據(jù)可以幫助我們了解:如果我們選擇了某種職業(yè),我們將來的生活會變成什么樣子?

      研究者將目光聚集在焦點(diǎn)小組上——由1800年到1920年之間年出生的名人組成,按照他們的職業(yè)分成演員、作家、政治家、科學(xué)家、藝術(shù)家和數(shù)學(xué)家6類人。這幅圖將使你的職業(yè)選擇變得容易多。

      如果想年少成名,那你可以選擇做一名演員。演員一般會在接近30歲或30歲出頭時(shí)成名并擁有一輩子的時(shí)間享受自己的名氣。不過,我們研究的這些演員還不能利用電視等大眾媒體推動其職業(yè)發(fā)展,其獲得的名望也沒有其他某些職業(yè)的名人高。

      如果你想將對名望的滿足延遲一小段時(shí)間,選擇做一位作家會比較合適。作家一般在接近40歲時(shí)成名,但是撰寫傳世佳作的頂級作家最終獲得的名望要比演員高得多。這一點(diǎn)在采用的圖書館數(shù)據(jù)上格外明顯,因?yàn)樽骷蚁矚g寫其他作家的事情。

      與你的預(yù)期相反,如果你非常想推遲成名的時(shí)間,那你最應(yīng)該選擇做政治家。政治家一般都在40歲之后、50歲之后甚至60歲之后才達(dá)到他們名望的巔峰。這時(shí)候,最出名的政治家一般會被選為美國總統(tǒng)(25個人中占了11人),或者成為其他國家的領(lǐng)導(dǎo)人(另外9人),他們的名望會迅速超過前兩組人。因此,如果你現(xiàn)在50多歲,而且尚未成為家喻戶曉的人物,那么政治正在向你招手。

      接下來,我們來觀察一下科學(xué)家。最著名的科學(xué)家最終獲得的名望和演員相差不大。但是,他們獲得名望所需要的時(shí)間要更長,一般是在60多歲時(shí),而不是演員一般所要成名的20多歲。較低的名望,較長的等待。很明顯和研究大爆炸理論相比,出演連續(xù)劇《生活大爆炸》是一個更好的選擇。

      更壞的選擇是繪制大爆炸理論或者繪制其他任何東西。在我們的列表中,藝術(shù)家遭遇了不公正的待遇。他們和科學(xué)家等待的時(shí)間一樣長,獲得的名望卻只有其一半。

      不過,如果你想出名,最壞的選擇是像“數(shù)字眼”的開發(fā)者一樣:從事數(shù)學(xué)研究。

      你或許不這么認(rèn)為。畢竟,據(jù)說數(shù)學(xué)家們最出色的工作大多是在他們年輕時(shí)完成,在那之后,他們就可以翹起二郎腿休息了。例如,數(shù)學(xué)王子高斯19歲時(shí)就發(fā)明了模算術(shù),證明二次互反律,推導(dǎo)了素?cái)?shù)定律——這是所有數(shù)學(xué)問題中最深刻、最根本的問題之一;還發(fā)現(xiàn)了將整數(shù)分解成三角數(shù)的深奧結(jié)論。然而這并不是他19歲那年做的所有事情,其實(shí)這些事情只花費(fèi)了3個多月的時(shí)間。這是多么偉大的成就。

      盡管如此,公眾根本不關(guān)注像高斯這樣的數(shù)學(xué)家年輕時(shí)做了什么。研究者所在的焦點(diǎn)小組里的數(shù)學(xué)家們成名時(shí),大多數(shù)已經(jīng)去世了。數(shù)學(xué)不會讓人成名。證明完畢。

      美國人何時(shí)認(rèn)同自己是“美國人”

      如今,美國人常把居住在南方各州的人,為“南方人”,把居住在北方各州的人稱為“北方人”,把居住在新英格蘭地區(qū)的人稱為“新英格人”。然而,人們卻把這些人統(tǒng)稱為“美國人”。為什么人們說到“美利堅(jiān)合眾國(The United States)”一詞時(shí)會使用單數(shù)形式(is)呢?這不僅僅是一個語法問題,更是一種國家認(rèn)同。在美國建立之初,建國文件《邦聯(lián)合永久聯(lián)合條例》(Article of Confederation and Perpetual Union)所規(guī)定的政府是弱中央政府,并且其中提到的新實(shí)體也不是一個國家,而是各個州的友好聯(lián)盟,當(dāng)時(shí)各州的人們并不認(rèn)為自己是美國人,而是稱自己為某個州的公民。正因如此,那時(shí)的人民在提到美國時(shí)會使用復(fù)數(shù)形式。那1787年美國《憲法》中“我們合眾國人民”(We the People)是何時(shí)轉(zhuǎn)變成1942年《效忠誓詞》中的“一個國家”(one nation)的?

      如果我們?nèi)枤v史學(xué)家,他們很可能會將我們引到詹姆斯?麥克弗森: (James McPherson )在其紀(jì)念美國南北戰(zhàn)爭歷史的著作《為自由而戰(zhàn)的吶喊》(Battle Cry of Freedom)中那個眾所周知的答案:南北戰(zhàn)勝消滅了國家分裂和奴隸制度;1861年之后,“美國”一詞從復(fù)數(shù)名詞走向了單數(shù)名詞。

      然后,我們是否應(yīng)該相信上面的結(jié)論?

      根據(jù)“數(shù)字眼”的觀察,我們前面所說的戰(zhàn)爭和語言的故事是錯誤的。首先,“美國”一詞從復(fù)數(shù)到單數(shù)的演變是一個漫長的過程,經(jīng)歷了19世紀(jì)第二個10年到20世紀(jì)80年代這150多年的時(shí)間。更重要的是,該演變過程中,兩個短語并沒有發(fā)生突然的過渡。實(shí)際上,戰(zhàn)爭年代之前或之后兩個短語的出現(xiàn)頻次并沒有多大的差別。復(fù)數(shù)形式到單數(shù)形式的演變在南北戰(zhàn)爭后稍有加速,卻始于南方聯(lián)軍總司令李將軍投降后5年后。直到戰(zhàn)勝結(jié)束15年后的1880年,“美國”一詞作為單數(shù)名詞開始在美國各州普及開來。甚至到今天,“美國”一詞的復(fù)數(shù)形式仍然在美國個別州有所出現(xiàn)。

      一圖勝千言

      1911年,美國著名報(bào)人阿瑟.布里斯班(Arthur Brisbane)對一些市場營銷人員說過—句著名的話:一幅圖“相當(dāng)于1 000個詞”,或許相當(dāng)于“1萬個詞”,又或許相當(dāng)于“100 萬個詞”?幾十年來,這句話傳遍了美國。布里斯班可能很惱火,因?yàn)檫@句話現(xiàn)在被認(rèn)為是一句日本諺語。畢竟,聽眾是市場營銷人員。

      布里斯班實(shí)際上說了什么呢?機(jī)器人不可能記錄下這句話首次出現(xiàn)的地方。這里有一句曰本諺語:

      和人類說過的所有話相比,

      谷歌掃描的書籍

      不過是三行俳句而已。

      不過,這個機(jī)器人可以幫助我們查看:布里斯班的標(biāo)志性經(jīng)濟(jì)學(xué)理念是如何形成的。

      事實(shí)表明,1 000個詞,1萬個詞和100萬個詞,這些變種都是布里斯班的著名評論之后很快出現(xiàn)的。在接下來的20年中,這三種形式相互競爭。期初,“1萬個詞”取得了領(lǐng)先。然后,到了經(jīng)濟(jì)大蕭條的20世紀(jì)30年代,人們或許覺得“1萬個詞”和“100萬個詞”的要價(jià)太高了吧?無論什么原因,那些年過后,“一幅圖”相當(dāng)于“1 000個詞“的表達(dá)漸漸成為主導(dǎo),并將另外兩個競爭者遠(yuǎn)遠(yuǎn)甩在了后面。

友情鏈接 : 百度新浪深圳點(diǎn)通
展開