دقت مدلهای هوش مصنوعی؛ در بهترین حالت ۶۹٪ !
بر اساس تحقیقات جدید گوگل و ارزیابی بنچمارک FACTS، حتی قویترین مدلهای هوش مصنوعی نیز با چالشهای قابل توجهی در زمینه دقت اطلاعات روبرو هستند.
به گزارش کلیک نتایج این تحقیق نشان میدهد که مدل Gemini 3 Pro با دقت ۶۹٪ بهترین عملکرد را از میان مدلهای مختلف هوش مصنوعی ارائه داده است. در مقابل، مدلهای سایر شرکتها از جمله OpenAI، Anthropic و xAI با دقتی پایینتر از این رقم قرار دارند. به این ترتیب، احتمال خطا در هر پاسخ حدود ۳۳٪ است، حتی اگر مدل با اعتماد به نفس بالا پاسخی ارائه دهد.
بر اساس گزارشهای فنی منتشرشده از سوی مراکز پژوهشی حوزه هوش مصنوعی، مدلهای پیشرفته زبانی اگرچه در تولید متن، تحلیل داده و پاسخگویی سریع عملکرد قابل توجهی دارند، اما همچنان در تشخیص اطلاعات نادرست، درک زمینههای پیچیده و ارائه پاسخهای دقیق با خطاهای جدی مواجهاند. این خطاها بهویژه در حوزههای حساس مانند پزشکی، حقوق، اقتصاد و سیاستگذاری میتواند پیامدهای پرهزینهای به همراه داشته باشد.
کارشناسان تأکید میکنند عدد ۶۹ درصد بهمعنای آن است که حتی پیشرفتهترین مدلها نیز در حدود یکسوم موارد، پاسخهای ناقص، نادقیق یا گمراهکننده تولید میکنند. پدیدهای که در ادبیات تخصصی با عنوان «توهم هوش مصنوعی» شناخته میشود؛ وضعیتی که در آن مدل، اطلاعاتی ظاهراً معتبر اما نادرست ارائه میدهد.
در عین حال، شرکتهای توسعهدهنده هوش مصنوعی معمولاً بر سرعت، مقیاسپذیری و توان یادگیری این سامانهها تأکید میکنند و منتقدان میگویند بحث دقت، اغلب در حاشیه تبلیغات پررنگ قرار میگیرد. این در حالی است که بسیاری از سازمانها بدون سازوکارهای راستیآزمایی انسانی، خروجی مدلها را مبنای تصمیمگیری قرار دادهاند.
تحلیلگران حوزه فناوری معتقدند مسئله اصلی نه صرفاً پایینبودن دقت، بلکه «اعتماد بیش از حد» به نتایج این مدلهاست. به گفته آنان، هوش مصنوعی در وضعیت فعلی بیشتر یک ابزار کمکی است تا مرجع نهایی تصمیمگیری، و استفاده ایمن از آن مستلزم نظارت انسانی، شفافیت الگوریتمی و آموزش کاربران است.
در مجموع، آمار ۶۹ درصدی دقت نشان میدهد فاصله قابل توجهی میان پیشرفت فنی هوش مصنوعی و انتظارات اجتماعی از آن وجود دارد. فاصلهای که اگر نادیده گرفته شود، میتواند به تصمیمهای اشتباه، تولید اطلاعات نادرست و تضعیف اعتماد عمومی به فناوریهای نوظهور منجر شود.