音訊指紋,或稱 audio fingerprint (AFP),是利用從音訊上抽取出的一些特徵,來進行音訊的搜尋。常見的應用時機之一,是你聽到廣播當中播放了一首歌,而你想用程式找出它是哪一首的時候。需要注意的是,AFP 演算法只能用於找尋原曲(有少數方法可以允許速度等方面的稍微變化),如果你想藉由人的哼唱來搜尋,請參考哼唱選歌;如果想搜尋重新演奏或翻唱版本,請參考翻唱曲辨識。
一般而言,進行一次查詢時,系統會回覆給你一些(例如十到二十首)候選歌曲,以便告訴你說你要搜尋的可能是這些歌;而如果你在查詢前其實已經知道自己查的是什麼歌,而系統回覆的候選歌曲中,答案排在愈前面的話,你很可能就會認為這個系統愈厲害。因此,音訊指紋常見的評估方式,是 top-n accuracy,以及 mean reciprocal rank (MRR)。假設我們做了 10 次查詢,而標準答案的位置分別在第 3、7、4、2、5、1、2、8、6、6 名的話,則因為 10 次裡面有 1 次是在第一名內,所以 top-1 accuracy 是 1 / 10 = 10%;10 次裡面有 3 次是在前兩名內,所以 top-2 accuracy 是 3 / 10 = 30%,依此類推;而 MRR 則是將標準答案的名次取倒數再平均,以此例而言,是 (1 / 3 + 1 / 7 + ... + 1 / 6) / 10 = 33.85%。