ویکیپدیا با مجموعه عظیم دادههای WIT دیتای مناسبی برای برنامهنویسهای هوش مصنوعی محسوب میشود.
این مجموعه دادهها شامل ۳۷.۶ میلیون نمونه تصویر و متن بوده و در ۱۰۸ زبان در دسترس است.
این دادهها میتوانند برای توسعه مدلهای یادگیری ماشین و سایر برنامههای هوش مصنوعی استفاده شوند.
دادهها در گیتهاب در دسترس است.