美國海軍新標案,想要蒐集全球3,500億筆社交媒體貼文

美國海軍本月公布了一項新標案,要求承包商蒐集逾100個國家的社交媒體貼文,且紀錄筆數至少要達到3,500億,此一合約價值3,850萬美元。

根據該標案所描述的需求,除了紀錄筆數至少要超過3,500億筆之外,它的時間至少要涵蓋從2014年7月1日到2016年的12月31日,必須蒐集來自逾100個國家的2億個不重覆使用者的訊息,單一國家的使用者不得超過30%,必須囊括至少60種語言,英文訊息不得超過50%。

此外,這些資料必須包含所有的公開訊息、評論或貼文,不得納入私人通訊訊息或使用者資料,每筆紀錄除了貼文之外,也必須附上國家、語言、位置、時間戳及網址等元資料。

美國海軍表示,此一專案是為了供美國海軍研究院(Naval Postgraduate School)國防及分析部進行研究之用,理解不同時間與不同國家的社會動態,建立語言社群進化的模型,得知集體表達的新興模式。除了可用來強化知識之外,也會作為教學之用,找出可作為學生論文基礎的觀點及發展學生的分析技巧。

原文來自 iThome Online