کلانپیکره ترگمان تاکنون از طریق خزش ۴۲۲ سایت داخلی به حجم مجوع بیش از ۳۱ میلیارد توکن در قالب بیش از ۵۴ میلیون سند در حوزههای گوناگون رسیده است.
کلانپیکره ترگمان در هاگینگ فیس قرار دارد و دسترسی به آن نیازمند تأیید است. برای دریافت حق بهرهبرداری غیر تجاری کافی است فرد متقاضی در هاگینگفیس اکانت با لینک به گیتهاب داشته باشد یا در حوزه LLM فعالیت کند.
ترگمان در راستای مسوولیت اجتماعی و با هدف گسترش فرهنگ آزادرسانی و تقویت هوش مصنوعی در کشور حق بهرهبرداری از این کلانپیکره را حق بهرهبرداری CC-BY-NC-SA قرار داده است.
خزشگر تخصصی ترگمان برای گردآوری این پیکره به صورت کاملاً متنباز و با حق بهرهبرداری LGPL-v۳ از طریق گیتهاب در دسترس است.
منبع: پیوست