
據知名科技媒體MarkTechPost報道,昨日,谷歌DeepMind團隊正式發布了名為WebLI-100B的千億級數據集。據悉,WebLI-100B數據集包含了驚人的1000億個圖像-文本對,規模遠超當前主流的數據集。DeepMind團隊此舉旨在解決當前視覺語言模型在文化多樣性和多語言性方面的局限性。
通過這一龐大的數據集,AI模型將能夠更好地理解和識別來自不同文化背景和多語言環境下的圖像與文本信息。
值得一提的是,WebLI-100B數據集在構建過程中,并沒有采用嚴格的過濾方式,而是專注于數據的擴展。這一做法使得數據集能夠保留更多語言和文化元素的廣泛代表性,從而提高了AI模型的包容性。
原創文章,作者:Google,如若轉載,請注明出處:http://www.bdzhitong.com/article/706321.html