هوش مصنوعی
موضوعات داغ

کلان‌پیکره زبان فارسی ترگمان با ۳۱ میلیارد توکن منتشر شد

کلان‌پیکره ترگمان تاکنون از طریق خزش ۴۲۲ سایت داخلی به حجم مجوع بیش از ۳۱ میلیارد توکن در قالب بیش از ۵۴ میلیون سند در حوزه‌های گوناگون رسیده است.

کلان‌پیکره ترگمان در هاگینگ فیس قرار دارد و دسترسی به آن نیازمند تأیید است. برای دریافت حق بهره‌برداری غیر تجاری کافی است فرد متقاضی در هاگینگ‌فیس اکانت با لینک به گیت‌هاب داشته باشد یا در حوزه LLM فعالیت کند.

ترگمان در راستای مسوولیت اجتماعی و با هدف گسترش فرهنگ آزادرسانی و تقویت هوش مصنوعی در کشور حق بهره‌برداری از این کلان‌پیکره را حق بهره‌برداری CC-BY-NC-SA قرار داده است.

خزشگر تخصصی ترگمان برای گردآوری این پیکره به صورت کاملاً متن‌باز و با حق بهره‌برداری LGPL-v۳ از طریق گیت‌هاب در دسترس است.

منبع:‌ پیوست

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا