دقت مدل‌های هوش مصنوعی؛ در بهترین حالت ۶۹٪ !

بر اساس تحقیقات جدید گوگل و ارزیابی بنچمارک FACTS، حتی قوی‌ترین مدل‌های هوش مصنوعی نیز با چالش‌های قابل توجهی در زمینه دقت اطلاعات روبرو هستند.

دقت مدل‌های هوش مصنوعی؛ در بهترین حالت ۶۹٪ !

به گزارش کلیک  نتایج این تحقیق نشان می‌دهد که مدل Gemini 3 Pro با دقت ۶۹٪ بهترین عملکرد را از میان مدل‌های مختلف هوش مصنوعی ارائه داده است. در مقابل، مدل‌های سایر شرکت‌ها از جمله OpenAI، Anthropic و xAI با دقتی پایین‌تر از این رقم قرار دارند. به این ترتیب، احتمال خطا در هر پاسخ حدود ۳۳٪ است، حتی اگر مدل با اعتماد به نفس بالا پاسخی ارائه دهد.

بر اساس گزارش‌های فنی منتشرشده از سوی مراکز پژوهشی حوزه هوش مصنوعی، مدل‌های پیشرفته زبانی اگرچه در تولید متن، تحلیل داده و پاسخ‌گویی سریع عملکرد قابل توجهی دارند، اما همچنان در تشخیص اطلاعات نادرست، درک زمینه‌های پیچیده و ارائه پاسخ‌های دقیق با خطاهای جدی مواجه‌اند. این خطاها به‌ویژه در حوزه‌های حساس مانند پزشکی، حقوق، اقتصاد و سیاست‌گذاری می‌تواند پیامدهای پرهزینه‌ای به همراه داشته باشد.

کارشناسان تأکید می‌کنند عدد ۶۹ درصد به‌معنای آن است که حتی پیشرفته‌ترین مدل‌ها نیز در حدود یک‌سوم موارد، پاسخ‌های ناقص، نادقیق یا گمراه‌کننده تولید می‌کنند. پدیده‌ای که در ادبیات تخصصی با عنوان «توهم هوش مصنوعی» شناخته می‌شود؛ وضعیتی که در آن مدل، اطلاعاتی ظاهراً معتبر اما نادرست ارائه می‌دهد.

در عین حال، شرکت‌های توسعه‌دهنده هوش مصنوعی معمولاً بر سرعت، مقیاس‌پذیری و توان یادگیری این سامانه‌ها تأکید می‌کنند و منتقدان می‌گویند بحث دقت، اغلب در حاشیه تبلیغات پررنگ قرار می‌گیرد. این در حالی است که بسیاری از سازمان‌ها بدون سازوکارهای راستی‌آزمایی انسانی، خروجی مدل‌ها را مبنای تصمیم‌گیری قرار داده‌اند.

تحلیلگران حوزه فناوری معتقدند مسئله اصلی نه صرفاً پایین‌بودن دقت، بلکه «اعتماد بیش از حد» به نتایج این مدل‌هاست. به گفته آنان، هوش مصنوعی در وضعیت فعلی بیشتر یک ابزار کمکی است تا مرجع نهایی تصمیم‌گیری، و استفاده ایمن از آن مستلزم نظارت انسانی، شفافیت الگوریتمی و آموزش کاربران است.

در مجموع، آمار ۶۹ درصدی دقت نشان می‌دهد فاصله قابل توجهی میان پیشرفت فنی هوش مصنوعی و انتظارات اجتماعی از آن وجود دارد. فاصله‌ای که اگر نادیده گرفته شود، می‌تواند به تصمیم‌های اشتباه، تولید اطلاعات نادرست و تضعیف اعتماد عمومی به فناوری‌های نوظهور منجر شود.

 

ارسال نظر