點擊右上角微信好友

朋友圈

請使用瀏覽器分享功能進行分享

正在閱讀:計算人口學的學科范式、理論基礎與技術方法
首頁> 論文推薦 > 正文

計算人口學的學科范式、理論基礎與技術方法

調查問題加載中,請稍候。
若長時間無響應,請刷新本頁面

  作者:黃匡時(中國人口與發展研究中心)

  摘要:闡釋了計算人口學的學科范式、理論基礎和技術方法。計算人口學作為研究人的行為的數字化和計算機化的科學,既是計算社會科學的基礎,也是開展計算社會科學研究的鑰匙和抓手。與傳統人口學的學科范式相比,計算人口學的學科范式有五個方面的特征:由輪廓式人口統計(profiling demography)向全景式人口統計(Panoramic demography)轉變;將彌合規范人口學(formal demography)和人口研究(population studies)的鴻溝,促進人口研究更加整合和規范;將引發人口研究方法的變革,由假想隊列法(hypothesis cohort analysis)向拓展隊列法(extended cohort analysis)轉變;人口的內涵不再局限在人類人口,而向數字人口和智能人口拓展;由偏重群體統計的宏觀人口學(macrodemography)將向更加注重個體統計的微觀人口學(microdemography)轉變。第三次人口轉變理論、主體性理論和天人合一理論是計算人口學的理論基石,拓展隊列法、在線調查和實驗、在線譜系學、主體建模技術是計算人口學的主要技術方法。作為新興科學,計算人口學面臨的機遇和挑戰并存,需要加強跨學科和產學研協作,加強數據基礎設施和研究規范建設,豐富應用場景,關注其對個人安全、隱私保護、道德倫理等方面的影響。

  一、計算人口學的誕生及其學科范式

  人口學是典型的數據驅動(data-driven)的學科。沒有人口統計數據就沒有人口學。人口學與人口統計數據是一個硬幣的兩個方面。因此,人口學(demography)又翻譯為人口統計學,是對人口死亡、出生、遷移等人口過程,以及對人口數量、結構、分布等人口結構進行統計分析的學科。人口學的誕生起源于對人口死亡數據的統計以及由此形成的生命表。1662年,英國學者格蘭特(John Grant)的著作《基于死亡登記的自然和政治的考察》(書名原文為Natural and Political Observations Mentioned in a Following Index, and Made Upon the Bills of Mortality)[1]出版,該書影響深遠,多次再版。格蘭特基于倫敦50萬死亡數據的統計分析,在書中形成了世界上第一張生命表,成為數理人口學(Mathematical Demography)和規范人口學(Formal Demography)的開創者。后世人口統計學的發展也非常重視人口統計數據的收集和整理。如今,全球范圍內也形成了很多高質量的人口統計數據庫,包括人類死亡數據庫(Human Mortality Database)、人類生育數據庫(Human Fertility Database)和微觀整合數據庫(IPMUS)等。這些數據庫的發展依賴于計算機技術的快速發展。而且在數字化時代,人口統計數據庫也將朝著更加廣闊的關聯數據庫發展。

  人口學其實是最早被計算機化(computational)的學科之一(Burch,1993)[2]。在計算機誕生之前,人口學基本是采用書面記錄、手工匯總的方式。但是隨著計算機技術的發展以及數理人口學的日漸成熟,人口統計學快速被計算機化。1974年,美國學者James B. Pick(1974)[3]采用計算機程序編制了人口年齡金字塔。1976年,美國人口普查局開發了一款人口統計分析的計算機程序(Computer Programs for Demographic Analysis)(Arriaga, Anderson and Heligman,1976)[4]。1985年,美國學者Charles J. Mode(1985)[5]將人口的隨機過程編寫成計算機程序,包括生命表和人口預測等。1988年,聯合國人口司發布了人口統計分析軟件MORTPAK,可以用來進行死亡、生育和人口預測等方面的分析(United Nations,1988)[6]。1997年6月24日,由美國國際發展局(U.S. Agency for International Development,簡稱USAID)資助,美國未來集團(the Futures Group)實施開發的SPECTRUM人口統計分析軟件正式發布。2010年,中國人口與發展研究中心發布了國際人口預測軟件PADIS-INT(翟振武等,2017)[7]。2014年中國人口與發展研究中心發布了人口綜合決策支持系統PADIS+。中國在人口統計分析的計算機化方面走在了世界前列。

  從目前現有文獻來看,計算人口學(Computational Demography)一詞的提出卻是20世紀的事情。但是與哈佛大學David Lazer等(2009)[8]15位學者于2009年在Science提出計算社會科學(Computational Social Science)相比,計算人口學的提出要相對早些。隨著仿真技術的快速發展,基于主體的計算人口學(Agent-Based Computational Demography)得到率先發展。2003年,意大利學者Francesco C. Billari和德國馬普人口研究所學者Alexia Prskawetz(2003)[9]聯合主編的《Agent-Based Computational Demography》(翻譯為中文為《基于主體的計算人口學》)一書詳細介紹了如何使用基于主體的計算人口學模型(Agent-Based Computational Demography,簡稱ABCD模型)去改善我們對人口行為的理解。隨后越來越多的人口學者采用基于主體的模型來研究人與關聯生命體(linked lives)之間的婚姻和家庭關系(Todd et al.,2005;Hills and Todd,2008;Diaz et al.,2011; Fent et al.,2013)[10][11][12][13]。2015年,德國學者Tom Warnke等(2015)[14]人開發了更加簡化、通用的、基于主體的計算人口學軟件ML3(Modeling Language for Linked Lives)。2017年,比利時學者André Grow和Jan Van Bavel(2017)[15]聯合主編了《人口研究中的基于主體建模:概念、方法和應用》(英文原文為Agent-based modelling in population studies : concepts, methods, and applications)系統地對人口研究中的基于主體建模進行了分析和研究。

  計算人口學的早期研究更多基于主體的計算人口學研究。因為基于主體的建模在分析人與關聯生命(liked lives)之間的行為具有獨特的優勢,而且也是最容易被計算機化的分析技術和方法。隨著互聯網、大數據、人工智能等數字技術的快速發展,萬物互聯將成為可能并日益緊密,人與人之間的關聯(linked)更加緊密(Giles,2012)[16]。人與經濟、社會、政治、文化、心理、倫理等之間的關系更加密不可分,人口學與經濟學、社會學、政治學、文化學、心理學、倫理學互相交織和融合。在一切可計算的社會,盡管所有社會科學的分支都可以單獨成為計算社會科學的一支,但是逐漸融合卻是必然。作為研究人的行為的科學,計算人口學是以人為核心(human-centric)的計算社會科學快速發展的基礎,也是開展計算社會科學研究的鑰匙和抓手。正因為如此,研究分析計算人口學具有重要意義。

  受互聯網、大數據、人工智能等數字技術的驅動,計算人口學研究范式應運而生。與傳統人口學研究范式相比,計算人口學研究范式具有五個方面的不同:第一,計算人口學的人口統計內容更加豐富多彩,由過去的輪廓式人口統計(profiling demography)向全景式人口統計(Panoramic demography)轉變。輪廓式人口統計局限在人口的出生、教育、婚育、家庭、職業、居住、遷移、養老和死亡等重要人口事件的統計,人與人(linked lives)的關聯更多局限在婚育家庭范圍;而全景式人口統計則將輪廓式人口統計的基礎上向經濟行為、社會行為、心理行為、環境等拓展,人與人的關聯超越婚育家庭,將關聯更加廣泛的經濟社會環境。第二,計算人口學將彌合規范人口學(formal demography)和人口研究(population studies)的鴻溝,促進人口學的研究更加整合和規范。傳統人口學方法長期存在規范人口學和人口研究兩條脈絡(宋健,2020)[17],但是隨著互聯網、大數據和人工智能等數字技術的快速發展,規范人口學和人口研究將加速計算機化進程,越來越多的綜合性人口決策智能支持系統相繼問世,比如,中國人口與發展研究中心開發的整合人口與經濟、社會、資源、環境的人口綜合決策支持系統PADIS+等。第三,計算人口學將引發人口研究方法的變革,由假想隊列法(hypothesis cohort analysis)向拓展隊列法(extended cohort analysis)轉變。由于學界過去觀察數據的不完整、不及時,常常用假想隊列的方法測算預期壽命和總和生育率,即采用時期的年齡別死亡率和年齡別生育率作為一個假想隊列的年齡別死亡率和年齡別生育率,事實上這是合成的(Synthetic)、人工的(artificial)、虛構的(unreal)隊列統計指標,但是隨著人口統計數據更加豐富、及時,隊列的真實數據將更加及時、全面,更加接近完全隊列法(cohort analysis)的拓展隊列法(extended cohort analysis)成為可能。第四,計算人口學認為,人類的一切行為皆可被數字化和可被計算,人口的內涵不再局限在人類人口,而向數字人口和智能人口拓展。隨著人類的行為和生活逐漸被數字化,人口的部分功能比如一些勞動屬性開始剝離,由機器替代,或者人機協同,由此,人口的內涵向數字人口和智能人口拓展(黃匡時,2020)[18]。第五,計算人口學認為,人與人更加密切地通過數字化方式聯系在一起,過去偏重群體統計的宏觀人口學(macrodemography)將向更加注重個體統計的微觀人口學(microdemography)轉變。傳統人口學更加關注宏觀人口統計,而計算人口學認為,微觀人口統計將更加注重個人生活史、個人婚姻家庭關系史、個人生育史、個體健康管理等方面的研究和分析,并在此基礎上實現微觀人口學和宏觀人口學的連接??傮w而言,與傳統人口學研究范式相比,計算人口學具有獨特的學科范式,體現了數據密集型的科學研究范式(孟小峰、張祎,2019)[19]。

  二、計算人口學的理論基礎

  計算人口學是由互聯網、大數據和人工智能等數字技術直接催生的新興學科,不僅有其鮮明的時代特征,而且有其深厚的理論基礎,至少體現在三個方面。

 ?。ㄒ唬┑谌稳丝谵D變理論

  經典的人口轉變理論(即第一次人口轉變理論)是由法國人口學家A.蘭德里(A.Landry)始創,后經過美國人口學家湯普森的潤色加工,到1945年美國人口學F.W.諾特斯坦(F.W.Notestein)基本成型,指的是傳統型人口再生產類型(即高出生率、高死亡率和低自然增長率)經過渡型人口再生產類型(高出生率、低死亡率和高自然增長率)向現代型人口再生產類型(即低出生率、低死亡率和低自然增長率)轉變的過程。經典的人口轉變理論較好地解釋了現代化進程與人口再生產類型之間的關系。歐洲國家基本在第二次世界大戰前完成了第一次人口轉變,并且在20世紀60年代開始,已經完成了第一次人口轉變的歐洲國家再次呈現了新的人口變動特征。荷蘭學者Van de Kaa于1986年提出第二次人口轉變理論。他認為,與第一次人口轉變相比, 第二次人口轉變無論在深度、廣度, 還是在變化的機理方面,都有很大的不同。這主要表現為:(1)從婚姻的黃金時期轉向同居的破曉;(2)從孩子為王的時代轉向以伴侶為中心的時代;(3)從預防性的避孕轉向自我實現的避孕;(4)從單一家庭模式轉向多元化的家庭戶模式(Van De Kaa,1987)[20]。這四個轉移在人口學的指標上表現出15個順序的變化,包括同性婚姻合法化、婚外生育被社會認同等等(蔣耒文,2002)[21]。

  第二次人口轉變已經過去了30多年。21世紀以來,隨著計算機技術、互聯網、大數據、人工智能等數字和計算技術的快速發展,人類的人口再生產呈現出新的特征:(1)醫學和生物學技術尤其是生殖輔助技術快速發展,凍卵、無精生殖、單性生殖以及智胚胎切割克隆等技術的成功或許不是夢想(喬杰,2008)[22],生育與女性身體開始剝離;(2)機器人的大量興起,在很多體力繁重、高強度、高風險的領域替代人類勞動,成為與人類相當的重要勞動力,在體力和智力等方面甚至超過人類勞動力;(3)人類生活和工作以及休閑日益被數字化,人類的數字孿生體日漸成型,成為與人類平行存在且與人類緊密關聯(linked)的主體(agent),人機協同將成為人類生活、工作和休閑的常態;(4)模擬人類智慧的人工智能的興起并快速發展,人類的解放由體力解放向腦力解放拓展,人口再生產已經向智力再生產轉變(黃匡時,2020)[23];(5)數字化讓人類更加緊密聯系在一起,人口的勞動和消費以及遷移已經數字化和全球化,與此同時人口再生產已經數字化、網絡化、全球化。人口再生產的這些變化使得人類正在經歷新的人口轉變,這里我們稱之為第三次人口轉變。第三次人口轉變是第一次人口轉變和第二次人口轉變的客觀必然。前兩次人口轉變導致的低生育率和低自然增長率是人口再生產的“內卷化”(involution),無法解決人口再生產的可持續性問題,而第三次人口轉變與前兩次人口轉變完全不同的,是人口再生產的外生化(externalization),即通過機器人等數字人口來彌補人類的低生育率和低自然增長率,從而實現人口再生產的新平衡。

 ?。ǘ┲黧w性理論

  人的主體性(Subjectivity)問題一直哲學和社會學理論的核心內容。自從啟蒙運動以來,現代性理論一直在思考人的主體性的價值意義(鄭杭生,楊敏,2006)[24]。主體性是現代性的核心原則。哈貝馬斯(1987)[25]認為,現代性是一種覺醒的時代意識,它以理性為基礎,以人的主體的自由為標志?;仡櫲祟惏l展歷史,人類現代化進程就是人的主體性不斷拓展和豐富的過程,尤其是科技革命使人類的主體性達到前所未有的程度。20世紀下半葉,以???、利奧塔、德里達為主要代表的后現代主義從主體概念本身、邏輯(理性)中心主義、樂觀主義三個方面對主體性進行徹底摧毀和全盤否定。哈貝馬斯通過建立在主體間性的溝通理性理論對主體性進行了拯救,認為從主體哲學到主體間性哲學的轉變只是解釋范型本身的改變,而不是主體性的消解;建立在主體間性基礎上的溝通理性理論可以克服人類中心主義的困境;主體性本身就意味著主體間性;人類主體性的異化根源于工具理性的膨脹和生活世界的抽象化,在溝通理性中可以克服主體的異化(劉日明,2001)[26]。馬克思認為,主體性具有實踐主體性(人與自然的主體與客體關系)、價值主體性(主體性的物質需要和精神需要)和社會主體性(主體性不僅是個體主體,更體現為群體主體性)三個維度(駱郁廷,2009)[27]。

  主體性理論是計算人口學的發展的重要理論基礎,尤其在機器人和人工智能的主體性上提供了豐富的理論解釋。目前關于機器人和人工智能的主體性存在兩種觀點:一是機器人和人工智能本身是人類主體性的拓展,不具備主體性。孫祥飛(2016)[28]認為,機器人參與新聞寫作和報道,既不是取代新聞工作者的主體性,也不是否定新聞工作者的主體性,恰恰相反,是延伸和強化了人的主體性。正所謂荀子在《勸學篇》中所說“君子性非異也,善假于物也”。張勁松(2017)[29]認為,人工智能在思維能力上無法超越人類思維和意識的整體性,對于感官和人腦的模擬仍處于機械化階段,更不能產生人類主體性所依賴的社會關系和實踐基礎。因此人工智能無法復制、模擬和超越人類主體性。朱建華和甄航(2019)[30]認為,基于認知科學的五個層級理論,人工智能在神經層級、心理層級、語言層級、思維層級、文化層級都無法與人類匹敵,其只是對人類智能形式上的簡單模擬,因此結合塞爾“中文房間模型”研判,認為人工智能并不具備刑法意義的“辨認能力”與“控制能力”,故當前的刑法理論不必將人工智能視為刑法主體性,可將其作為“犯罪工具”和“犯罪對象”對待。第二種觀點認為,機器人和人工智能具備獨立意識,能夠獨立做出判斷,具有獨立的權利能力、行為能力和責任能力,主張法律應賦予其權利和義務,將其法律地位等同于自然人或擬制的法律主體。持這種觀點的人大都基于“電子代理人說”,即將智能機器人視為其“所有人”的代理人,“電子代理人說”則將機器人的用戶或者操作者與機器人(人工智能體)的關系認定為法律代理關系中本人與代理人的關系。電子代理人說得到很多國家的認可。美國統一州法全國委員會于1999 年8 月通過的《統一電子交易法》(Uniform Electronic Transactions Act)(修訂稿)第2 條對“電子代理人”進行了定義:“系指非經人的行為或審核,全部或部分獨立地發起某種行為或應對電子記錄或履行的計算機程序、電子手段或其他自動化手段?!?加拿大1999 年通過的《統一電子商務法》中同樣使用了“電子代理人”一詞。2016 年5 月31 日,歐盟委員會法律事務委員會提交一項動議,要求歐盟委員會把正在自動化智能機器工人的身份界定為電子人的身份,并賦予這些機器人依法享有著作權等特殊的權利與義務(張勇,許亞潔,2020)[31]。當然,不少學者持“有限法律人格說”,認為,強人工智能的機器人具有自主性和適應性特征,從法律技術上可以承認其主體人格,賦予其擬制主體地位,而弱人工智能則不具備自主性,不應納入擬制主體地位。因此,可以在有限范圍內承認人工智能法律擬制人格,而且機器人的法律權利有別于人類的“自然權利”,具有擬制性、利他性以及功能性等(張勇,許亞潔,2020)[31]。

  無論是支持人工智能主體性觀點,還是否定人工智能主體性觀點,主體性理論毫無疑問都會深化數字化時代人類主體性的理解,加深人類對人類本身與機器人等數字人口在主體性上的相似性和差異性的研究,是計算人口學的重要理論基礎。

 ?。ㄈ┨烊撕弦焕碚?/p>

  天人合一是我國重要的哲學思想(張岱年,1985)[32],儒、道、釋等諸家各有闡述。天指自然和天道,天人合一多指人與道合而達到“天地與我并生,萬物與我為一”的境界。當今,5G技術快速發展,正在實現萬物互聯、智慧家居和無人駕駛。而且6G技術即將到來。人與萬物的聯通即將實現。因此,有人認為,5G是萬物互聯,6G就是天人合一。在“萬物互聯”的數字化時代,“以人為本、天人合一”思想將為計算人口學提供豐富的營養。

  人機一體化理論和人-機-環綜合決策理論都是天人合一思想的重要體現。路甬祥(1994)[33]在分析人與機器的各自優缺點的基礎上,結合思維科學理論、信息科學理論、人工智能技術和機械科學的新進展,提出了人機一體化(Humachine)的思想,并在思維、感知和執行三個不同層面上對人機一體化系統與技術思想進行了立論。后來,越來越多的學者提出了“人機融合”、“人機融合體”、“人機智能”、“人機智能體”、“人機融合智能系統”等概念,這些都體現了人機融合的思想。黃孝鵬等(2012)[34]創造性地提出“人即服務”的理念,將人以服務組件的形式“浸入”到決策系統中,進而凝練出與“硬件”和“軟件”相對應的“人件”與“人件服務”的概念,認為,人件(Humanware) 是參與決策活動的人,可由個人、群體或組織提供,具有決策者的認知(認知共享)特征,是針對新型決策系統中人機高效協作問題所提出的一種概念,為探索將人的高級智慧融入到決策系統中提供突破口;人件作為決策系統組成要素之一,同硬件、軟件一起接受系統統一管理和調度,并和它們相互緊密協作完成決策任務,為設計和實現能充分體現決策者浸入及認知特征的人機協同決策系統提供先進的思路,成為以人為中心的系統組件理論重要內容。劉偉(2019)[35]認為,人機協同是一種由人、機、環境系統相互作用而產生的新型智能形式,采用分層的體系結構,即人類通過后天完善的認知能力對外界環境進行分析感知,其認知過程可分為記憶層、意圖層、決策層、感知與行為層,形成意向性的思維,而機器通過探測數據對外界環境進行感知分析,其認知過程分為目標層知識庫、任務規劃層、感知與執行層,形成形式化的思維。相同的體系結構指明人類與機器可以在相同的層次之間進行協同。勵建安(2020)[36]認為,康復機器人是康復專業人員的又一條手臂,而不是替代康復專業人員,這體現了“人機融合”的理念,而且人機之間最大的結合點是人的思維和意圖識別,機器人最難突破的是人類具有的道義感和仁愛心,康復機器人貫穿著改善-代償-替代-環境改造的康復路徑,體現了天人合一的健康理念。

  三、計算人口學的技術方法

  計算人口學是人口學和計算機技術交叉學科,因此其技術方法既有傳統人口學方法上的創新發展,比如與紙質調查不同的在線調查和在線實驗,與假想隊列方法不同的拓展隊列法等,也有計算機技術的延續和發展,比如主體建模方法和在線譜系學。因此,本文主要介紹計算人口學上述四個主要技術方法:

 ?。ㄒ唬┩卣龟犃蟹ǎ‥xtended Cohort Analysis)

  采用完全隊列法(Cohort analysis)計算平均壽命,需要等這個隊列的所有人去世后才能計算出來,同樣的,采用完全隊列法計算生育水平,需要等這個隊列的所有育齡婦女度過其49歲的育齡期才能統計出來,而當這個隊列的平均壽命和平均生育子女數計算出來之后,對這個隊列的平均壽命和生育水平等統計指標不僅缺乏政策補救價值,而且也無法反映當下的預期壽命和生育水平,因此,人口學常常采用假想隊列法(Hypothesis cohort analysis),用時期的年齡別死亡率和時期的年齡別生育率作為一個假想隊列的年齡別死亡率和年齡別生育率,由此核算平均預期壽命和總和生育率,用來反映當下的預期壽命和生育水平。受年齡和時間的自然規律的限制,我們根本不可能用完全隊列法來測量當前的預期壽命和生育水平,只能用假想隊列法來替代完全隊列法,這是一種退而求其次的策略。但是在數字化時代,微觀個案數據日益豐富,使得我們可以采用更好的方法來替代假想隊列法,即拓展隊列法(Extended Cohort Analysis)。拓展隊列法不是完全隊列法,但是更加接近完全隊列法。

  拓展隊列法的誕生有其時代背景。當前,有兩個條件催生了拓展隊列法:一是微觀個案數據的豐富,不僅覆蓋了接近全員的微觀個案,而且所有微觀個案的信息豐富,這使得個案的健康管理和生育行為具有穩定的可預測性;二是微觀個案的相關數據信息及時、準確,從而可以實現個體的行為規律的及時分析和預測。而這兩個條件正是數字化和人工智能時代可以滿足的。因此,拓展隊列法就是數字化時代的產物,有其客觀必然性。拓展隊列法的基本思路是基于微觀個案的大數據,根據死亡和生育行為的相關預測算法,預測所有微觀個案的死亡和生育規律,由此形成了基于拓展隊列法的全員人口的完全隊列信息,然后基于相鄰隊列法修正所有個體的預測值,由此獲得基于拓展隊列法的平均預期壽命和生育水平(見圖1)。拓展隊列法不僅可以矯正假想隊列法獲得的統計指標,而且還可以獲得拓展后的全員人口的完全隊列統計指標。

  圖1完全隊列法、假想隊列法和拓展隊列法(以總和生育率為例)

 ?。ǘ┰诰€調查與實驗(Online Surveys and Experiments)

  在線調查與互聯網的發展緊密關聯。在互聯網發達的歐美和日韓,在線調查非常成熟。我國在線調查才剛剛起步,但是隨著互聯網的快速發展而迅速發展。根據2021年2月3日中國互聯網絡信息中心(CNNIC)發布第47次《中國互聯網絡發展狀況統計報告》,截至2020年12月,我國網民規模達9.89億,互聯網普及率達70.4%?;ヂ摼W、大數據和人工智能等大數據的快速發展催生了在線調查。與線下面對面的入戶調查不同的是,在線調查憑借互聯網技術,將設計好的問卷放在網上,等待任意網民或者特定的網民自行填答,因此,在線調查具有低成本、高速度、跨越時空局限、有著豐富的表現形式、具有智能化及互動性等優點(黎沛姿,譚北平,2005)[37]。不過,在線調查也存在顯而易見的局限。比如樣本代表性問題。我國網民中68.7%是城鎮網民,高于我國的城鎮化率(60.6%),而且年齡別結構也與總人口的結構分布存在偏差。因此,在線調查的樣本肯定是有偏差的,需要加權處理。此外,在線調查的答題過程缺乏交流和監控,填答者在答題的情景也多種多樣,這些都可以影響答題的可靠性。正因為如此,關于在線調查數據的清理和修正技術也在不斷發展(李軍軍,李應榮,2005)[38]。

  在線實驗就是在互聯網上開展的實驗研究,又稱為基于互聯網的實驗(web-based experiment或者Internet-based experiment)。在線實驗因其成本低、高效率、匿名性、主題廣等特征而受到研究著的喜愛。比如互聯網心理學實驗室開展暴力網絡游戲的實驗,即通過在游戲中增加暴力射殺等血腥元素,由此考察玩家對攻擊性行為的認知以及暴力視頻游戲的短期脫敏效應,揭示研究變量之間的因果關系。又如在線社交網絡控制實驗通常分為嵌入模式和平臺模式,嵌入模式通常直接在真實的大尺度社交網絡(如Facebook 和Twitter)上進行實驗,實驗規模巨大,通常涉及數萬乃至數千萬用戶,而平臺模式是一種將傳統線下控制實驗轉移到線上平臺執行的模式,充分利用互聯網和計算機技術,擴大了線下實驗的規模,同時能夠對更復雜的影響因子進行控制,并模擬部分在線社交網絡的操作與特征,更便于進行社交網絡結構演化以及心理學實驗研究(金誠等,2020)[39]。此外,眼動實驗(eye movement experiment)也是一種常見的在線實驗,主要觀察消費者認知過程和識別具體眼動軌跡的方法,能夠發現消費者策略和探索潛在的認知過程,在分析在線評論對消費者的認知的影響中得到廣泛應用(伍玉婷,2020;唐曉莉,宋之杰,2020)[40][41]。

  與在線調查相比,在線實驗具有更高的技術難度。相比于實驗室實驗,在線實驗對實驗條件的控制更弱,往往采用可控性低的電子郵件、APP等工具。有些在線實驗準入門檻高,成本也巨大,比如要在社交網絡上開展實驗嵌入式實驗就會面臨準入門檻的問題。目前在線社交網絡集中在少數大型企業手中,普通研究人員不具備開展控制實驗的條件。而且在線社交網絡的控制實驗需要依靠特定的APP,軟件開發和大數據清洗、甄別、標注和分析等需要高昂的成本,制約了控制實驗的普及。此外,在線實驗也會面臨一些法律和倫理道德的問題,比如侵犯用戶個人隱私,不僅有悖于科學研究的倫理道德,甚至可能違法(金誠等,2020)[39]。

 ?。ㄈ┰诰€譜系學(Online genealogy)

  譜系學(genealogy)俗稱家譜。家譜中承載著世系表資料,記載著每個家庭成員的出生日期、婚育狀況、遷移信息和死亡日期等信息,是開展人口學研究的寶貴資料,可以開展預期壽命、生育水平、人口年齡結構、人口遷移等方面的研究(Clark,2014;李會敏,2015;Fire and Elovici,2015)[42][43][44]。在計算機技術普及之前,人類的家庭基本都是通過書本記載,隨著從計算機技術尤其是互聯網技術的快速發展,在線譜系學應運而生。在線譜系學包括兩個方面的內容:一是歷史家譜的計算機化,俗稱網上修譜;二是在世人口的譜系化過程,即將人與人建立在線關聯(linked lives)。

  歷史家譜的計算機化就是家譜檔案的數字化過程。其中,建設家譜數據庫和家譜網站就是家譜檔案數字化的主要方式。美國國家檔案與文件署、英國國家檔案館、澳大利亞國家檔案館、加拿大國家圖書館與檔案館都非常重視家譜數據庫的建設,不僅建設了規模龐大的家譜數據庫,而且還放到網站上供查詢使用。我國國家圖書館數字圖書館、上海圖書館、浙江圖書館等都開設了家譜數據庫(韋加佳,2014)[45]。家譜網站最早可以追溯到1983年美國的世系網(Ancestry)。如今該網站包含了270億條記錄和1億個家庭樹(family tree),是全球最大的家譜網站。該網站還可以通過注冊,建立自己的賬號,并將自己的家庭成員進行關聯,由此實現在世人口和祖先的譜系化過程。世系網(Ancestry)包括了出生、婚育、死亡、移民等豐富的人口信息,是人口學的寶貴數據。如今,在線家譜網站和在線家譜的手機APP快速發展(張振霞,2019)[46]。人們可以通過手機APP就可以將自己與家人和族人建立關聯。如果人人都成為在線家譜的一部分,那么整個世界的人口都可以納入到在線譜系中。邁赫里蒂奇(MyHeritage)公司于2012年建立的杰尼網(geni)就是在線譜系學網站,就是致力于將整個世界的人口吸引到該網站中。目前該網站覆蓋了過去400年的8600萬個案(profiles)和1300萬的世系(pedigrees),其中55%來自歐洲,30%來自北美??ㄆ仗m尼等人(Kaplanis et.al.,2018)[47]基于杰尼網(geni)的家庭樹數據進行了清洗和分析,發現人口統計數據存在偏差,并進行了偏差校正。

  在線譜系學是計算機技術發展的必然,是實現世界人口數字化鏈接(digital linked)有效途徑。當然,由于追溯性固有的缺陷,采用在線譜系學建構的數字家譜必然存在一定的偏差,當然,這種偏差是可以修正的,而且隨著未來世界人口數字化和譜系化進程的推進,這種偏差會越來越小。

 ?。ㄋ模┲黧w建模技術(Agent-based modeling)

  主體建模又稱為智能體建模,是一種基于計算機技術的建模方法,廣泛應用于社會科學研究。諾貝爾獎得主、經濟學家Thomas Schelling(1971)[48]對種族隔離的主體建模實驗研究、政治學家Robert Axelrod(1984)[49]對囚徒困境的主體建模研究、愛普斯坦(Epstein)和??怂固兀ˋxtell)(1996)[50]對人工社會的主體建模研究等都是主體建模在社會科學領域的經典研究。由于人口學具有較規范的數理淵源和很強的實際政策應用,因此,主體建模方法在人口預測、婚育過程、家庭關系、遷移、養老支持、家庭政策等人口學領域得到廣泛應用(Billari and Prskawetz,2003; Grow and Jan Van Bavel,2017)[9][15],并形成了一系列主體建模軟件和平臺,比如MIMOSE(Mohring,1996)[51]、ML3(Tom Warnke et.la.,2015)[14]和JAS-mine(www.jas-mine.net)(Richiardi and Richardson,2017)[52]。其實,計算人口學就是微觀人口仿真(microsimulation)技術以及主體建模(agent-based modeling)技術的基礎上發展起來的,因此,主體建模技術是計算人口學的經典技術方法。

  主體建摸技術之所以成為計算人口學的經典技術方法,主要因其有一些獨特優勢(陳禹,2003;Fagiolo &Roventini,2012;隆云滔等,2018)[53][54][55]:(1)以微觀個體為出發點,自下而上對宏觀人口現象進行建模,因此,可以充分地發揮作為主體或智能體的主體性和智能性以及異質性(比如人與人、人與機器的差異)優勢;(2)主體有限理性且具有學習本性,比較符合作為主體的人和機器以及群體的特性;(3)主體間非線性的直接交互(包括競爭),而且從宏觀到微觀的回路也是非線性的(包括不確定性),比較符合人與人、人與群體、人與機器、人與機器群之間的互動關系。計算人口學中的主體建模分析方法是通過計算機技術模擬出一個人工人口或虛擬人口(也是數字人口),并通過設置各種人口變量來模擬人口過程,為解釋人口現象提供了一種動態分析路徑。通常,主體建模技術方法需要三個方面的建模工作:一是為主體設置一個模型,包括主體的基本屬性、行動規則和規則解釋器;二是為主體所在的社會或自然環境建模,包括主體之外的所有社會關系和社會網絡;三是為主體的運行過程建模。主體建模本質上是一個形式邏輯模型,可以理解各種情景下的人口過程和人口結構的“結果涌現”(outcome emergence),更適合理論的發展和解釋,為解決具體問題提供情景參考。當然,主體建模技術作為一個形式邏輯,只能接近真實的人口過程,現實中依然需要結合實證數據來研究具體政策(黃璜,2010)[56]。此外,主體建摸技術的技術門檻較高,尤其在萬物互聯的數字化時代,主體建模技術面臨新的機遇與挑戰。

  四、計算人口學面臨的機遇挑戰與政策建議

  計算人口學的興起具有鮮明的時代特征。當前,互聯網、大數據、云計算、人工智能等數字計算正蓬勃發展,尤其是2019年底新冠肺炎疫情全球暴發后,數字技術加快發展,計算人口學迎來了良好的發展機遇。隨著互聯網普及率不斷提高,越來越趨向覆蓋全員目標人口。5G技術加快普及,6G技術即將到來,人與人之間、人與機之間、人與環境之間的融合速度前所未有,而且顛覆經典超級計算機的量子計算技術加快布局,成為推動計算人口學快速發展的重要推動力。同時,以互聯網、物聯網、5G和6G通信技術、量子計算、人工智能、數字孿生等為代表的數字技術群落不斷融合、疊加和迭代升級,為數字經濟發展提供了高經濟性、高可用性、高可靠性的技術底座,構建了驅動數據密集型的科學研究范式快速發展的基礎設施,為計算人口學的蓬勃發展提供了重要的技術生態。2020年12月28日,國家發改委發布《關于加快構建全國一體化大數據中心協同創新體系的指導意見》的通知,提出“到2025年,全國范圍內形成一批行業數據大腦、城市數據大腦,全社會算力資源、數據資源向智力資源高效轉化的態勢基本形成”的建設目標,為“十四五”時期我國計算人口學的發展創造了良好的政策環境。

 ?。ㄒ唬C遇與挑戰

  作為一門新興科學,計算人口學也面臨諸多挑戰(王飛躍等,2010;孟小峰等,2013;張小勁,孟天廣,2017;David et.al.,2019)[57][58][59][60]。第一,計算人口學屬于計算機科學和人口學的交叉學科,面臨交叉學科的技術方法和激勵機制以及學科結構等方面的挑戰。由于計算人口學在技術方法上需要一定的計算機編程技術,至少需要熟練R語言或Python語言等計算機編程技術,而且還需要對人口學的行為規律算法熟悉,因此計算人口學的研究人員既要懂得計算機編程又要熟練數理人口學的算法。第二,計算人口學所需要的密集型大數據分散在公共機構和私營企業中,面臨數據整合和共享的挑戰。與公共機構共享微觀人口數據不同的是,掌握大量微觀人口的社交網絡、出行軌跡、消費等行為數據的私營企業在數據共享上缺乏有效的共享激勵,由此制約了計算人口學家的數據使用。第三,計算人口學面臨數據收集和使用、信息共享、調查和實驗、算法規則等方面的規范不健全的挑戰。第四,計算人口學也面臨隱私保護和倫理道德等方面的挑戰。計算人口學的研究與個人數據緊密關聯,往往不可避免涉及倫理道德,加上計算人口學面臨的科學風險常常會成為個人隱私保護和倫理道德等方面的借口,從而制約計算人口學的科學研究。

 ?。ǘ┱呓ㄗh

  我們在機遇和挑戰面前,要推動計算人口學的發展。第一,需要加強協作,不僅要加強跨學科協作,而且還需要加強產學研協同創新發展,實現政務大數據與企業大數據的融合和共享;第二,要加強以人為中心、人-機-環協同融合的數據密集型基礎設施建設,加快人類數字化、智能化和協同化進程;第三要加強計算人口學在數據收集和使用、信息共享、調查和實驗、算法規則等研究規范建設,既可以學者自覺倡議,形成學術研究共同準則,也可以通過法律等進行規范;第四,豐富計算人口學在解決實際問題方面的應用場景,包括促進數字經濟發展、人口安全和可持續發展、疫情防控、人口普查和監測、增強政策包容性、公平性和可及性等方面;第五,關注計算人口學對個人安全、隱私保護、道德倫理等方面的影響,加強科學知識普及和宣傳,合理引導科學研究和社會輿論。

  參考文獻

  [1]Graunt J. Natural and political observations. Mentioned in a following Index, and made upon the Bills of Mortality[M]. Tho: Roycroft, London,1662:11-15.

  [2]BURCH T K. Theory, computers and the parameterization of demographic behavior[N]. IUSSP International Population Conference, Montreal. Li6ge: IUSSP, 1993,3:377-388.

  [3]PICK J B. Computer display of population age structure[M].Demography. 1974,11(4):673-682.

  [4]ARRIAGA E, ANDERSON P, HELIGMAN L. Computer Programs for Demographic Analysis[M]. Washington, D.C., Government Printing Office.1976

  [5]MODE C J.Stochastic Processes in Demography and their Computer Implementation[M]. Springer, Berlin. 1985.

  [6]UNITED NATIONS. MORTPAK-The United Nations Software Package for Mortality Measurement:Batch-oriented Software for the Mainframe Computer[N].ST/ESA/SER.R/78. 1988.

  [7]翟振武,李龍,陳佳鞠,等.人口預測在PADIS-INT軟件中的應用——MORTPAK、Spectrum和PADIS-INT比較分析[J].人口研究,2017,41(06):84-97.

  [8]LAZER D, PENTLAND A, ADAMIC L, et al. Computational Social Science[J]. Science. 2009,323(5915):721-3.doi: 10.1126/science.1167742.

  [9]BILLARI F C, PRSKAWETZ A (eds). Agent-based Computational Demography. Using Simulation to Improve our Understanding of Demographic Behaviour[M]. Heidelberg: Physica Verlag (Springer). 2003.

  [10] TODD P M, BILLARI F C, SIMAO J. Aggregate Age-at-Marriage Patterns From Individual Mate-Search Heuristics[J]. Demography.2005,42 (3): 559–574.

  [11] HILLS T, TODD P. Population Heterogeneity and Individual Differences in an Assortative Agent-Based Marriage and Divorce Model (MADAM) Using Search with Relaxing Expectations[J]. Journal of Artificial Societies and Social Simulation.2008,11 (4): 5.

  [12] DIAZ B A, FENT T, PRSKAWETZ A, et al. Transition to Parenthood: The Role of Social Interaction and Endogenous Networks[J]. Demography.2011,48 (2): 559–579.

  [13] FENT T, APARICIO DIAZ B, PRSKAWETZ A. Family Policies in the Context of Low Fertility and Social Structure[J]. Demographic Research,2013, 29 (37): 963–998.

  [14] WARNKE T, STEINIGER A, UHRMACHER A M, et al. ML3: A language for compact modeling of linked lives in computational demography[N].2015 Winter Simulation Conference (WSC), Huntington Beach.CA.2015, pp. 2764-2775. doi: 10.1109/WSC.2015.7408382.

  [15] GROW A, VAN BAVEL J(eds.). Agent-Based Modelling in Population Studies[M]. TSSDMPA, Springer, Cham.2017,41. https://doi.org/10.1007/978-3-319-32283-4

  [16] GILES J. Computational social science: Making the links[J]. Nature.2012,488(7412):448-50. doi: 10.1038/488448a. PMID: 22914149.

  [17] 宋健.人口學方法的傳承與演變——兼論中國人口學學科發展[J].人口與經濟,2020(04):1-14.

  [18] 黃匡時.數字化時代的人口學發展:從人類人口學向數字人口學轉變[J].人口與社會,2020,36(01):25-37.

  [19] 孟小峰,張祎.計算社會科學促進社會科學研究轉型[J].社會科學,2019(07):3-10.

  [20] VAN DE KAA DJ. Europe's second demographic transition[J]. Popul Bull. 1987 Mar;42(1):1-59. PMID: 12268395.

  [21] 蔣耒文.“歐洲第二次人口轉變”理論及其思考[J].人口研究,2002(03):45-49.

  [22] 喬杰.人類輔助生殖技術的新進展[J].中國實用婦科與產科雜志,2008(1):33-34.

  [23] 黃匡時.人工智能時代人口研究的前瞻性思考[J].人口研究,2020,44(03):118-128.

  [24] 鄭杭生,楊敏.個人的當代形貌:社會化理論的世紀挑戰——人的主體性的新發展與以人為本的時代源泉[J].河北學刊,2006(03):73-82.

  [25] HABERMAS J. The Philosophical Discourse of Modernity[M], trans. Frederick Lawrence, Cambridge, MA: MIT Press.1987:242.

  [26] 劉日明.哈貝馬斯的主體性理論及其現實意義[J].上海社會科學院學術季刊,2001(03):116-123.

  [27] 駱郁廷.馬克思主義主體性理論的三個維度[J].武漢大學學報(人文科學版),2009,62(01):5-10.

  [28] 孫祥飛.“機器人新聞”與新聞工作者的主體性強化[J].新聞論壇,2016(02):42-44.

  [29] 張勁松.人是機器的尺度——論人工智能與人類主體性[J].自然辯證法研究,2017,33(01):49-54.

  [30] 朱建華,甄航.人工智能刑法“主體性”否定:緣起、解構、反思——以認知科學的五個層級為基礎[J/OL].重慶大學學報(社會科學版):1-12[2021-01-09].http://kns.cnki.net/kcms/detail/50.1023.C.20191225.0926.002.html.

  [31] 張勇,許亞潔.智能機器人主體性的刑法審視[J].上海政法學院學報(法治論叢),2020,35(02):105-114.

  [32] 張岱年. 中國哲學中“天人合一”思想的剖析[J]. 北京大學學報(哲學社會科學版),1985,(01):3-10.

  [33] 路甬祥,陳鷹.人機一體化系統與技術——21世紀機械科學的重要發展方向[J].機械工程學報.1994,13(5):1-7.

  [34] 黃孝鵬,周獻中,楊潔,毛可,盛寅. 人機協同決策系統中人件及人件服務的概念體系研究[A]. 中國系統工程學會.社會經濟發展轉型與系統工程——中國系統工程學會第17屆學術年會論文集[C].中國系統工程學會:中國系統工程學會,2012:10.

  [35] 劉偉. 人機融合智能的現狀與展望[J]. 國家治理,2019,(04):7-15.

  [36] 勵建安. 人機共融,天人合一——關于康復機器人應用與發展的思考[J]. 中國康復醫學雜志,2020,35(08):897-899.

  [37] 黎沛姿,譚北平.在線調查的代表性與可靠性對比研究[J].市場研究,2005(08):7-11.

  [38] 李軍軍,李應榮.在線調查估計偏差分析及相應措施[J].統計與決策,2005(06):26-28.

  [39] 金誠,江婷君,閔勇,等.在線社交網絡控制實驗的現狀與展望[J].浙江大學學報(理學版),2020,47(01):1-11.

  [40] 伍玉婷.旅游目的地在線評論對旅游者有用性感知的影響研究——基于眼動實驗[J].旅游研究,2020,12(06):68-81.

  [41] 唐曉莉,宋之杰.在線評論對異質性消費者購買決策的影響研究——基于眼動實驗[J].情報科學,2020,38(04):83-88.

  [42] CLARK M. A Survey of Online Digital Newspaper and Genealogy Archives: Resources, Cost, and Access[J]. Journal of the Society for American Music.2014,8(2):277-283. doi:10.1017/S1752196314000170

  [43] 李會敏.淺談家譜文獻價值及其開發策略[J].邊疆經濟與文化,2015(06):138-140.

  [44] FIRE M, ELOVICI Y. Data Mining of Online Genealogy Datasets for Revealing Lifespan Patterns in Human Population[J], ACM Transactions on Intelligent Systems and Technology.2015,6(28):1-22. https://dl.acm.org/doi/pdf/10.1145/2700464

  [45] 韋加佳.美、英、澳、加四國家譜檔案信息資源開發利用途徑及啟示[J].北京檔案,2014(10):32-35.

  [46] 張振霞. 中國近二十年來網上修譜歷程考察[D].寧波大學,2019.

  [47] KAPLANIS J, GORDON A, SHOR T, et al. Quantitative analysis of population-scale family trees with millions of relatives[J].Science.2018,360(6385):171-175.doi: 10.1126/science.aam9309.

  [48] SCHELLING T. Dynamic Models of Segregation[M].Journal of Mathematical Sociology.1971,1:143-186.

  [49] Axelrod R. The Evolution of Cooperation[M].New York: Basic Books.1984:173.

  [50] EPSTEIN J M, AXTELL R L. Growing Artificial Societies: Social Science from the Bottom Up[M].MA: MIT Press.Cambridge.1996.

  [51] MOHRING M. Social Science Multilevel Simulation with MIMOSE.In Social Science Microsim-ulation[M].edited by TROITZSCH K G, MUELLER U, GILBERT G N. London, UK:Springer. 1996,P123–137.

  [52] RICHIARDI M, RICHARDSON R E. Agent-Based Computational Demography and Microsimulation Using JAS-mine. In: Grow A., Van Bavel J. (eds) Agent-Based Modelling in Population Studies[M].The Springer Series on Demographic Methods and Population Analysis.Springer.Cham,2017, vol 41.https://doi.org/10.1007/978-3-319-32283-4_4

  [53] 陳禹.復雜性研究的新動向——基于主體的建模方法及其啟迪[J].系統辯證學學報,2003(01):43-50.

  [54] FAGIOLO G, ROVENTINI A. Macroeconomic Policy in DSGE and Agent-Based Models[J]. Revue de l'OFCE,2012,5:67-116.

  [55] 隆云滔,李洪濤,王國成.基于主體的建模方法與宏觀經濟政策分析[J].經濟與管理,2018,32(02):47-52+80.

  [56] 黃璜.社會科學研究中“基于主體建?!狈椒ㄔu述[J].國外社會科學,2010(05):40-47.

  [57] 王飛躍,曾大軍,毛文吉.社會計算的意義、發展與研究狀況[J].科研信息化技術與應用,2010,1(02):3-14.

  [58] 孟小峰,李勇,祝建華.社會計算:大數據時代的機遇與挑戰[J].計算機研究與發展,2013,50(12):2483-2491.

  [59] 張小勁,孟天廣.論計算社會科學的緣起、發展與創新范式[J].理論探索,2017(06):33-38.

  [60] LAZER D, PENTLAND A, WATTS D J, et al. Computational social science: Obstacles and opportunities[J].Science,2020.369,6507,Pp. 1060-1062.

[ 責編:王曉秋 ]
閱讀剩余全文(

相關閱讀

您此時的心情

光明云投
新聞表情排行 /
  • 開心
     
    0
  • 難過
     
    0
  • 點贊
     
    0
  • 飄過
     
    0

視覺焦點

  • 核心價值觀百場講壇走進青島嶗山

獨家策劃

推薦閱讀
洪水口村位于北京市門頭溝區清水鎮西部,北京最高峰靈山腳下,面積25.98平方公里,現有村民158戶,313人,黨員33人,素有“靈山門戶”之稱,曾先后榮獲北京市民俗旅游專業村、北京市最美鄉村、北京市“五個好”基層黨組織、中國最美休閑鄉村稱號。
2021-05-07 14:05
加載更多
438yy电影