您的位置: 11选5陕西 > 科学发展 >

联系我们

  • 010-69586324

11选5开奖:聲學所元勋通順设立基於小波譜圖和深

文章来源:admin 时间:2019-01-04

  聲學所元勋通順创造基於小波譜圖和深度卷積網絡的音頻場景識別新框架

  近年來,網絡上音頻的種類和數量呈現爆發式增長。比拟語音和音樂,音頻中的環境音信愈加众樣,遭到瞭國內外研讨者的廣泛關註。

  音頻場景分類的目标是識別出錄制音頻的特定場景,從而使穿着式設備、智能機器人感知周圍的環境音信並做出相應反射。傳統的音頻分類任務多半利用短時特质,如梅爾頻率倒譜系數等。可是,環境音信平淡隱藏正在分歧時長的后台聲中,于是提取众分别率众标准的特质是音頻場景分類的關鍵 。

  近期,聲學研讨所語言聲學與內容会意重點實驗室博士生陳航艇遵照豐田預期,隨著兩款產品上市,混動車型正在華銷量將晋升至當前途度的10倍,借此成為正在華銷量的新增長點美國國度高速公道交通清静管束局3日发外,日本高田公司正在美國消費和銷售存正在缺陷的清静氣囊,違背瞭美國《機動車清静法》,對該公司處以2億美元罰款  及其導師張鵬遠等人提出瞭一種基於小波變換和深度卷積神經網絡的場景識別新手段。相關研讨结果已被Proceedings of the Annual Conference of the International Speech Communication Association(2018)收錄。

  研讨人員提出的音頻場景分類系統包含前端和後端兩個模塊。前端选用分歧時長和頻率分佈的小波濾波器來提取小波譜圖,此濾波器組可以同時搜捕到轉瞬即逝的音頻事宜和長時的韻律節奏。後端的深度卷積神經網絡結合小卷積核和池化操作,將“高維語義”從原始特质中抽象出來。

  正在相關場景數據集上的實驗結果标明,利用小波譜圖和深度卷積神經網絡的音頻場景識別外現明顯優於傳統的短時特质。比拟短時特质,長時的小波譜圖的時間分别率較低,笃信秤谌上下降瞭存儲和計算的哀求。

  該研讨為音頻場景的领悟供应瞭新的前後端架構,為環境聲音的研讨供应瞭新思道。

  參考文獻:CHEN Hangting, ZHANG Pengyuan, BAI Haichuan, YUAN Qingsheng, BAOXiuguo, YAN Yonghong. Deep Conventional Neural Network with Scalogram for Audio S18~20日,冷氣氛减弱,南風加大,北部大氣散开條件平淡,地區氣氛質量以優至良為主;廣西局部為輕度混濁;湖南、湖北為良至p度混濁,局部為中度混濁cene Modeling. Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH, v 2018-September, p 3304-3308. DOI: 10.21437/Interspeech.2018-1524.

  

  

基於小波變換和深度卷積網絡的場景識別系統(圖/陳航艇)

  

 

Copyright © 2018-2019  11选5陕西|11选5开奖|11选5走势   http://www.shutoan.com  .All Rights Reserved   网站地图    电脑版(PC)移动版(MOBILE)