請記住本站域名:
黃金屋
學(xué)習(xí)使我富裕 第135章 震驚,這個作者居然學(xué)會了……
連語法、關(guān)鍵詞都不一定看的出來了。
后來一次又一次地把每周獎勵替換成對小C的升級迭代,又融合了后來的語言反應(yīng)智能模塊。
這下,蘇航是徹底看不懂了。
蘇航在手機上敲著一個語音小程序。
前兩天老媽和他抱怨,這個手機上的字太小了,一些軟件功能也不會用,說明的字體就更小了,每次都要瞇著眼睛才看得清。
蘇航手把手地把每一個常用軟件給老媽講清楚了,還把字體調(diào)大,但還是覺得不太保險。
蘇航撓撓頭。
發(fā)際線不知不覺上移中……
他只好從比較清楚的方向,語音識別來開展工作。
一開始他以為,語音識別也就那樣吧,應(yīng)該不難。
不過就是自然語言的處理嘛。
其原理,也就是輸入聲波信號,并將其轉(zhuǎn)化為文本序列。
而輸入的時候,需要去噪聲。
蘇航之前再數(shù)學(xué)建模的時候就已經(jīng)了解過所謂的去噪聲,那時董利老師還特地拿這個問題考了蘇航一下。
有的時候,這個步驟一不小心就跳過了。
聲波中的噪聲就更是格外明顯。
最容易認知到的就是環(huán)境噪聲,當然還有一些由于保真啊什么的導(dǎo)致噪聲干擾。
這個蘇航還是會的。
分幀、加窗、預(yù)加重、特征提取。
選擇特征參數(shù),基音周期,共振峰,短時平均能量或幅度,線性預(yù)測系數(shù),感知加權(quán)預(yù)測系數(shù),短時平均過零率,線性預(yù)測倒譜系數(shù),自相關(guān)函數(shù),梅爾倒譜系數(shù),小波變換系數(shù),經(jīng)驗?zāi)B(tài)分解系數(shù),伽馬通濾波器系數(shù)……
蘇航寫寫畫畫,不得不說,數(shù)學(xué)真的好用,不愧是第一大理科學(xué)類。
數(shù)學(xué)就像是退而織網(wǎng)一樣,不去想這網(wǎng)有什么用,就慢慢地、自顧自地發(fā)展著,等到那一天,漁夫(物理學(xué)家等科學(xué)家)突然發(fā)現(xiàn)這網(wǎng)太好用了,以前想都不敢想的大魚,也可以輕松捕獲,才開始感慨那些看似沒用的數(shù)學(xué)。
比如黎曼幾何,在數(shù)十年后的廣義相對論才體現(xiàn)出它驚人的價值。
以前,數(shù)理不分家,漁夫要撈什么樣的魚,就得自己去織網(wǎng)。
而現(xiàn)在,數(shù)學(xué)似乎和物理分成了兩門學(xué)科。
但是實際上,數(shù)學(xué)卻依舊為所有的學(xué)課提供著最有力的工具。
蘇航最初以數(shù)學(xué)作為突破口,也是存了這樣的心思。
高屋建瓴、居高臨下地從數(shù)學(xué)入手,對其它專業(yè)各個擊破。
把握重點論,抓住主要矛盾,何愁大業(yè)不興。
蘇航很快就準備好了信號處理和特征提取。
當然離不開小C的幫忙。
接下來就是測試語音訓(xùn)練和利用歐氏距離、協(xié)方差矩陣、貝葉斯距離來進行失真判決。
通常來說,語音識別技術(shù)可以分為三類。
模型匹配、概率統(tǒng)計、辨別器分類。
蘇航選擇的是神經(jīng)網(wǎng)絡(luò)的方法,屬于辨別器分類方法之一。
基于循環(huán)神經(jīng)網(wǎng)絡(luò)和長短時記憶模塊進行建模。
循環(huán)神經(jīng)網(wǎng)絡(luò)在深度神經(jīng)網(wǎng)絡(luò)的隱層上增加了一個反饋連接,這讓它更加適合用在時序信號的建模上,還有一定的記憶功能,也即可以根據(jù)上下文語境來做出判斷和決策。
引入長短時記憶模塊則是為了解決傳統(tǒng)簡單RNN梯度消失等問題。
不過蘇航發(fā)現(xiàn)一個問題。
爸媽說話并不算是特別標準的普通話,方言、口音混雜,這也就意味著自己要么自己輸入訓(xùn)練數(shù)據(jù),要么就得找相關(guān)公司、領(lǐng)域研究所的數(shù)據(jù)庫來訓(xùn)練。
而且訓(xùn)練數(shù)據(jù)不一定準確夠用。
比如自己輸入,就這放假七天,就算爸媽一刻不停的說話,連續(xù)24小時也沒用啊。
不夠多,最后形成的模型就不夠精確。
更重要的是,這也不足以實現(xiàn)之前的目標。
自己做出來的也只是一個類似于市面上的語音助手,甚至還不如他們的。
所以,蘇航停下筆。
要不花一筆積分吧。
分出一個小小C來?
那這可不就有了一個超智能助手了?
而且,小C強大的學(xué)習(xí)能力是它最大的優(yōu)勢。
這讓小C可以不需要預(yù)先投喂大量的數(shù)據(jù),而是一邊使用,一邊學(xué)習(xí)改進。
自適應(yīng),這才是小C最大的優(yōu)勢。
而且,有小C跟著爸媽,蘇航也放心一些。
現(xiàn)在網(wǎng)絡(luò)詐騙、推銷騙子這么多,蘇航覺得有必要防范一下。
一般的手機助手可能識別不了詐騙,但是小C可以啊。
這就給小C再開一個域名,就開那個法律文書網(wǎng)。
讓小C好好學(xué)一學(xué)法律規(guī)范。
再輸入一些防詐騙手冊和案例教學(xué)。
這何愁會被騙啊。
小C的未來不可限量啊,不過得找個時間給它換個載體了。
這臺移動工作站時不時的發(fā)燒,蘇航還真擔(dān)心哪天就給燒壞了。
說干就干。
蘇航呼出了系統(tǒng)界面。
此時積分已經(jīng)相當?shù)母挥嗔耍吘固K航近期沒有怎么花過積分。
詢問系統(tǒng),答復(fù)果然是肯定的。
而且和以往一樣,允許使用每周獎勵機會來替代部分積分。
蘇航毫不猶豫地用獎勵做了替換。
這周要回家,根本沒怎么好好學(xué)習(xí),換來的獎勵說不定又是那種很菜的。
這樣的話,其實就相當于把每周獎勵換成了自己想要的東西。
而且可以用積分來加強。
花在爸媽身上的東西,蘇航果斷地用積分強化了一波。
結(jié)果得到的居然是!
加個語音助手吧。
雖然現(xiàn)在手機上也也有一些人工智障,但那個根本滿足不了使用要求。
沒有注釋的源代碼,這就是天書啊。
而且當初小C是以多種語言及其編譯器作為藍本,交由系統(tǒng)和積分進行完善組成的。
之前就嘗試過解析小C,結(jié)果很不理想。
在家的日子好無聊。
所以蘇航就參照著小C的語言功能,打算自己弄一個出來。
最起碼的要求是,可以識別語音和他們這的方言,然后在手機里查找到相應(yīng)的功能。
好在蘇航把小C帶了回來,不然全靠自己弄,那可就難敲代碼了。
蘇航甚至難以理解小C的一些基本代碼原理。
更重要的是,沒有注釋,沒有注釋,沒有注釋。
重要的事情說三遍。
再進一步,那就是根據(jù)使用者的要求,來完成使用者想要達成的目標。
所以,蘇航就開始自己弄咯。
而且,小C已經(jīng)和這臺電腦的操作系統(tǒng)深度綁定,但是從系統(tǒng)界面來看,它又可以隨時剝離,且適配任何系統(tǒng),只要硬件符合要求。
這就很神奇。
其實小C就足以完成大部分的功能,要是可以分出一個小小C來就好了。
不需要太多的智能,只要語音識別和文檔生成與分析就行了。
進一步就是可以讀出軟件的一些說明,以及解釋一些功能,并做出一些風(fēng)險性的判斷。
學(xué)習(xí)使我富裕最新內(nèi)容記住老\幺\小\說\網(wǎng)w\w\w。l\a\o\y\a\o。\o\r\g
快捷鍵: 上一章("←"或者"P") 下一章("→"或者"N") 回車鍵:返回書頁