«فیلیپ وانگ»، توسعهدهندهای که مسئولیت مهندسی معکوس سیستمهای هوشمصنوعی منبع بستهای از جمله Make-A-Video متا را برعهده دارد، PaLM + RLHF را منتشر کرد، یک مدل تولید متن که رفتاری مشابه ChatGPT دارد.
سیستم جدید PaLM، یک مدل زبان بزرگ از گوگل و تکنیکی به نام یادگیری تقویتی با بازخورد انسانی (RLHF) را با یکدیگر ترکیب میکند تا سیستمی را ایجاد کند که میتواند تقریباً مشابه با ChatGPT هر کاری را انجام دهد.
اما نکته مهم اینکه PalM + RLHF از قبل آموزش دیده نیست. به این معنا که PaLM + RLHF در حال حاضر دقیقاً تجربهای شبیه به ChatGPT را در اختیار کاربران قرار نمیدهد.