amzoncamzon.com articlesforpost.com chinacutwire.com cirikhas.com do-my-essays.com economiaforense.org toptravellists.net travelfortoday.com wp-stinger.com toptravellists.net travelfortoday.com wp-stinger.com infosyncworld.net joseefilm.co.uk linimasanews.com mafemmesebarre.com mangalyrics.com matthewsonmain.com medecine-sciences.com murillolawfirm.com mysalvatoreferragamo.com orangetwig.com ott-party.com persiram.com placasolarmadrid.com sellmyhousebeforeforeclosure.com ty5aaaa.com ultihow.com spbukini.com spbuindah.com spbudatang.com spbugesit.com spbugitu.com spbujumpa.com spbuketiga.com spbumegah.com spbumenemani.com spbupertama.com spbuterbaik.com spbuterpukau.com spbutoto.5g.in spbutoto.6g.in spbutoto.ai.in spbutoto.am.in spbutoto.business.in spbutoto.info.in toptravellists.net spbutoto.com.in spbutoto.delhi.in spbutoto.dr.in spbutoto.io.in spbutoto.it.com spbutotojaya.com www.spbutotoyuk.com spbutujuan.com spbu toto spbutoto spbutoto spbutoto spbutoto spbutoto situs togel terpercaya spbutoto situs toto situs togel terpercaya situs togel terpercaya spbutoto spbutoto spbutoto 10 situs togel terpercaya spbutoto spbutoto spbutoto spbutoto spbutoto spbutoto 10 situs togel terpercaya 10 situs togel terpercaya 10 situs togel terpercaya toto 5000 togel 5000 togel 5000 situs toto situs toto togel slot bandar togel bo togel terpercayaتقنيات جوجل تتفوق على الخبراء في تدقيق حقائق النماذج اللغوية الكبيرة - عالم التقنية
الأخبار

تقنيات جوجل تتفوق على الخبراء في تدقيق حقائق النماذج اللغوية الكبيرة

كشفت دراسة جديدة أجراها فريق بحثي من شركة DeepMind التابعة لشركة جوجل، عن تفوق نظام الذكاء الاصطناعي على المدققين البشريين في تقييم دقة المعلومات التي تُنتجها النماذج اللغوية الكبيرة.

وقدمت الورقة البحثية، التي حملت عنوان “الحقيقة في نماذج اللغة الكبيرة”، طريقة جديدة تُسمى “مدقق الحقائق المُعزز بالبحث” لتقييم صحة المعلومات بشكل آلي. حيث يقوم هذا النظام بتجزئة النص المُنتج إلى حقائق فردية، ثم استخدام نتائج البحث في جوجل لتحديد دقة كل ادعاء.

وأظهرت النتائج أن تقييم النظام الآلي تطابق مع تقييمات المدققين البشريين بنسبة 72%، ولكن في حالات الخلاف بينهما، ثبتت صحة تقييم الذكاء الاصطناعي في 76% من الأحيان، وهو ما وصفه الباحثون بـ “الأداء الخارق”.

غير أن بعض الخبراء يشككون في مفهوم “الأداء الخارق” هنا، إذ يرى البعض أنه قد يُشير فقط إلى التفوّق على الموظفين منخفضي الأجر، وليس بالضرورة أفضل من خبراء التدقيق البشريين.

ومع ذلك، فإن أحد مزايا النظام الآلي تتمثل في انخفاض تكلفته، إذ وجد الباحثون أن استخدامه كان أرخص بنحو 20 مرة من تكلفة التحقق البشري. ومع ازدياد حجم المعلومات التي تُنتجها النماذج اللغوية، ستصبح القدرة على التدقيق منخفض التكلفة أمرًا بالغ الأهمية.

استخدم فريق DeepMind نظامهم لتقييم دقة حقائق 13 من أبرز النماذج اللغوية الكبيرة عبر 4 أنظمة (جيميني و جي بي تي و كلود و بالم-2) على مقياس جديد أُطلق عليه اسم “LongFact”. وأشارت النتائج إلى أن النماذج الأكبر حجمًا أنتجت عددًا أقل من الأخطاء.

ولكن، حتى أفضل النماذج أداءً لا تزال تُنتج عددًا كبيرًا من المزاعم الخاطئة، مما يُبرز مخاطر الاعتماد المفرط على نماذج الذكاء الاصطناعي القادرة على التعبير بطلاقة عن معلومات غير دقيقة.

وقد تلعب أدوات التحقق الآلي مثل “مدقق الحقائق المُعزز بالبحث”، دورًا رئيسيًا في التخفيف من هذه المخاطر. ومع ذلك، لا تزال هناك حاجة إلى المزيد من الشفافية حول المعايير البشرية المستخدمة في هذه الدراسة.

وبينما تتسابق الشركات التقنية العملاقة لتطوير نماذج لغة أكثر قوة للاستخدامات التي تتراوح بين البحث والمساعدين الافتراضيين، فإن القدرة على التحقق الآلي من الحقائق من مخرجات هذه الأنظمة ستكون عاملًا حاسمًا. وتُمثل أدوات مثل “مدقق الحقائق المُعزز بالبحث” خطوة مهمة نحو بناء طبقة جديدة من الثقة والمسؤولية.

المصدر

مقالات ذات صلة

زر الذهاب إلى الأعلى
spbutoto spbutoto situs togel terpercaya situs togel terpercaya spbutoto spbutoto spbutoto 10 situs togel terpercaya situs togel terpercaya spbutoto spbutoto spbutoto spbutoto spbutoto 10 situs togel terpercaya 10 situs togel terpercaya bo togel terpercaya spbutoto