洗耳恭聽的時代:語音識別

電腦聽到我們的聲音並進行分析,同時,經由持續的互動來知道我們的意圖,這就是「語音識別」,而現今的應用則是有蘋果手機的Siri、Amazon的Alex智慧音箱,以及Google Home語音助理等。 哼唱選歌(Query By Singing/Humming,簡稱 QBSH) 希望能夠找到整段歌聲基本頻率隨時間而變的向量(稱為音高向量),根據這個向量,才能和資料庫中的歌曲進行比對,找出最相似的歌曲以讓電腦幫忙辨識出來這是哪一首歌。請大家藉由範例或者是唱一小段歌曲來體會一下語音識別的強大功能吧!

在此感謝,國立台灣大學資訊工程學系張智星教授以及多媒體資訊檢索實驗室成員的協助。

使用操作一:使用範例檔案

使用操作二:自己唱