為助計算機視覺實現新突破，谷歌發布全球最大的人工和自然地標數據集

長按識別二維碼，報名2018十大突破性技術中國區線下解讀會

圖像分類技術在過去幾年中取得了顯著的進步，這在一定程度上體現在Imagenet 分類挑戰上，機器的誤差率每年都在大幅下降。

為了繼續推進計算機視覺技術的先進水平，許多研究人員現在更多地關注細粒度和實例級的識別問題，而不是識別一般實體，如建築物、山脈，當然還有貓，許多人正在設計能夠識別埃菲爾鐵塔、富士山或波斯貓的機器學習算法。

然而，這一領域研究的一個重大障礙是缺乏大量帶註釋的數據集。

而就在今天，谷歌在其官方博客宣布，發布 Google-Landmarks 數據集來推進實例級的識別，這也是世界上最大的人工和自然地標識別數據集。

Google-Landmarks 將作為 Kaggle 網站上地標識別和地標檢索挑戰發布，這將是 CVPR 18 地標研討會的重點。

該數據集包含二百萬多幅圖像，描繪了來自世界各地的三萬處獨特的地標，數據集類別的數量比常用的數據集大 30 倍。此外，為了促進這一領域的研究，我們是開源的深度本地特徵( DELF )，我們認為這是一種非常好的本地特徵描述方法，特別適合於這類任務。

地標識別與其他問題有一些顯著的區別。例如，即使在大型帶標註的數據集中，對於一些不太熱門的地標，也可能沒有太多的訓練數據。此外，由於地標通常是不動的物體，所以內部變化很小（換句話說，地標的外觀在不同的圖像中變化不大）。

因此，變化只會由於圖像捕獲條件而產生，如遮擋、不同的視角、天氣和光照，這與其他圖像識別數據集不同，其中特定類別的圖像（如狗）的變化可能更大。這些特徵也與其他實例級識別問題（如藝術品識別）有共同之處，

因此，谷歌希望這個新的數據集也能對其他圖像識別問題的研究有所幫助。

這兩項 Kaggle 挑戰將為研究人員解決這些問題提供了獲取帶標註的數據的途徑。 識別軌跡挑戰是在測試集中建立識別正確地標的模型，而檢索挑戰則要求參與者檢索包含相同地標的圖像。 通過 Kaggle 網站就能訪問到這個新的數據集。

-End-

編輯：LXQ 校審：黃珊

參考：

https://research.googleblog.com/2018/03/google-landmarks-new-dataset-and.html?m=1