日韩无码视频免费看_亚洲综合色一区二区三区_国产成人久久AV免费看国语版_A人片中文字幕一区二区

實現與逝者跨時空對話 AI光會模仿原聲還不夠

2019-11-05 09:06:18  來源:科技日報  


[摘要]“如果有個直達天堂的電梯,我一定不顧一切去看你。”日前火爆抖音的這首神曲唱出了不少人對已逝親人的懷念之情。...

  “如果有個直達天堂的電梯,我一定不顧一切去看你。”日前火爆抖音的這首神曲唱出了不少人對已逝親人的懷念之情。如果有可以和已逝親人進行跨時空對話的“黑科技”,相信對活著的人不啻為一種巨大慰藉。而隨著人工智能技術的發(fā)展,與逝者的跨時空對話或有可能實現。百度董事長兼CEO李彥宏曾表示,人工智能讓每個人說的每句話、干的每件事,甚至記憶、情感、意識都能以數字化的形式存儲下來放在網盤或者其他云端,思維方式也可以被機器學習,并且通過技術進行還原,與后人進行跨越時空的對話。

  模擬和逝者對話 國內外均有嘗試

  “這種模擬已逝的人與后人進行對話的事情在國內外都有過嘗試。”天津大學智能與計算學部博士生導師王龍標教授介紹,2011年3月11日日本大地震,許多人的生命就此定格在那個瞬間。由于災難發(fā)生得非常突然,很多遇難者都沒有留下只言片語,這讓不少遇難者家屬悲痛欲絕,情感上難以接受。日本就找了一些科研人員,收集遇難者生前保存的聲音,模仿逝者的口吻寫了遺書,并且通過語音合成技術,還原出逝者的聲音并且讀給家屬聽。家屬聽了以后都非常感動,覺得了卻了自己的一個心愿,很多人也因此放下悲傷,鼓起勇氣,勇敢去面對未來的人生。

  在國內比較廣為人知的嘗試就是2016年,在張國榮誕辰60周年紀念活動上,百度語音技術團隊公布了一段“張國榮”與粉絲的對話實錄視頻。張國榮作為一個時代的巨星,影響了千萬粉絲,當熟悉的聲音響起,很多粉絲當場落淚,“張國榮”最后一句“永遠站在光明的角落,我只希望你們開心快樂地生活”也一掃很多粉絲心頭多年的陰霾。這段視頻是百度語音技術團隊通過機器和人工雙重搜索全網張國榮的原聲和采訪資料后,合成的張國榮生前的聲音,并且在錄制視頻之前征集粉絲想法,與粉絲一起完成的“互動”視頻。這段“來自哥哥”但又“不是哥哥”的語音回復,音質完全來自于本人,但內容又并不能在任何一段張國榮生前的語音記錄中找到,是一封根據逝者生前講話風格編寫的,來自2016年的“答粉絲信”。

  “以上的這些嘗試都只停留在模仿逝者語音、語言方式層面。”王龍標說,已逝者說的內容基本上都是科研人員事先編輯好的內容,雖然目前在技術上計算機也能自動生成文本和文字,但是模仿的效果還不是很理想。比如像日本那個案例,目的就是鼓勵生者更好的生活下去,如果內容編輯不當,反而會適得其反。因此這些嘗試,都不是真正意義上和后人“對話”。

  做到原音重現 需收集大量數據

  為了讓逝者原音重現,技術公司利用大數據與深度學習、語音合成技術,將張國榮在影視、電臺和各種渠道留存下來的原聲進行建模,并通過合成帶有一定情感的聲音模型合成了這封“答粉絲信”。通過語音合成技術實現了規(guī)?;恼Z料生產和自動化的數據標注,并充分發(fā)掘了深度學習技術在大數據上的處理能力,極大地擴展了語音合成系統(tǒng)所能使用的合成語料庫的體積,使得語音合成系統(tǒng)包含了一定的情感,且更接近張國榮原聲。

  “無論是已經能夠實現的模擬逝者單方面的說話,還是未來要想實現的跨時空對話,目前的技術首先都離不開逝者生前大量的數據收集。”王龍標說,計算機要學習某個人,必須要先大量收集這個人的各種信息,在這個人生前就要把他寫的文字、聲音、圖像、腦信號等通過各種形式保存下來。比如模仿寫作風格,必須要收集他以前寫過的書信、文章等,模仿一個人的語言,就需要通過錄音了解他的口音、發(fā)音習慣、習慣用語、語言邏輯等。數據收集得越全,機器會模擬得越相似,這就和夫妻相一樣,夫妻朝夕相處久了,會潛移默化地在行為方式、語言習慣等方面高度相似。百度相關負責人曾表示,張國榮的“答粉絲信”原音重現,之所以仍存在一些頓挫感,出現某些字詞發(fā)音略不自然等情況,部分原因是受到相關情景語料缺失的限制。

  在收集大量數據的基礎上,一般來說,模擬逝者語言需要語音合成、機器學習、自然語言處理等技術。如果要想做成更有感情的語言,還需要情感計算。具體來說,就是把情感因素通過計算機的方法識別和表達出來,比如這個人的語言、寫的文字、各種肢體動作都代表什么情感,然后讓機器去模仿并生成情感,寫具有情感的文章,生成具有情感的語言,或者表達一些具有情感的肢體動作。

  實現隔空對話 腦科學研究不可少

  要實現對話,語音對話技術也必不可少,這就需要機器對對方的語言進行判斷識別,并且理解、自動生成文本。目前比較常見的智能音箱應用的就是語音對話技術。不過很多時候,這些智能音箱回答的問題似是而非,只有回答對于那些設定好的問題,如天氣預報、打開電視機、放一首歌曲等問題的時候,這些智能音箱才能準確地完成對話和指令。王龍標表示,要想實現機器和人之間良好的互動,就需要機器能模仿人的思維和情感,這樣才能讓機器的回答更聰明一些,更個性化,而不是千篇一律的答案。

  據報道,目前瑞典科學家正進行研究,通過在大腦植入微型裝置,讓使用者得以上載及下載自己的思想。王龍標表示,目前的情感計算,大部分是基于數據驅動的機器學習技術。如果想實現真正意義上的模擬人的意識、情感,還涉及到腦科學的范疇。不過人的大腦非常復雜,目前對人的意識、情感感知、理解與產生的生理機制的研究還非常粗淺,因此獲取人的意識、情感并且記錄保存下來目前還很難做到。此外,人的情感是非常復雜的。讓機器認識情感并且能夠擁有情感,并且在對話中通過對方的話語進行判斷,和對方進行情感的交流,這在目前階段還無法實現得很好,也是科研人員努力的方向。

  讓逝者精神永生 或面臨倫理風險

  雖然保存一個人的信息似乎可以讓他精神永生,并能給生者帶來極大的安慰,但是這種做法也存在一定的風險。王龍標表示,不排除有些人會惡意利用這些逝者的信息,為了達到自己的某種目的,模仿逝者的聲音,同時把自己的意圖加入進去,假冒逝者的想法去操控活著的人。

  此外,這種通過人工智能實現的“精神永生”還可能涉及到倫理問題。這有點像克隆技術,如果未來可以通過芯片技術達到模擬逝者思維的目的,甚至通過基因編輯的方式去保存復制人的思維,這些做法就很可能賦予機器人自主意識。機器人可能會有自己的思想、喜怒哀樂等情感,那么這種具備他人意識的機器人是否會面臨倫理風險呢?而且當這些機器人被賦予了“生命”,其脫離控制又該如何處理?目前機器人的倫理標準還未明確,但當技術足夠先進,這方面的倫理風險也會加劇,如何應對是我們需要充分考慮的問題。(陳 曦)

編輯: 羅亞秀

相關熱詞: AI 模擬 語音
分享到:

以上文章僅代表作者個人觀點,本網只是轉載,如涉及作品內容、版權、稿酬問題,請及時聯系我們。電話:029-63903870

本網所有文字、圖片和音視頻等,版權均屬各界新聞網所有,任未經本網協議授權不得轉載、鏈接或其他方式復制發(fā)表,違者本網將依法追究責任。
各界新聞網 版權所有 Copyright(C) 2006-2020 gjnews.cn All Rights Reserved     備案號:陜ICP備13008241號-1