ابزار ادعا می کند که متقلبانه را که از هوش مصنوعی ChatGPT برای سرقت ادبی سوء استفاده می کنند، شناسایی می کند.

ChatGPT می‌تواند کد یا مقاله مدرسه و هر نوع محتوایی را در پاسخ به یک درخواست انسانی (متن) بنویسد. ربات چت OpenAI همچنین به راحتی قابل سوء استفاده است، محتوای جدیدی برای تقلب در طول امتحانات ایجاد می کند یا کل وب سایت ها را با زباله های متنی بی ارزش – اما به طور سطحی متقاعدکننده – پر می کند. در پاسخ به این، ادوارد تیان، 22 ساله، کارشناس ارشد علوم کامپیوتر در دانشگاه پرینستون، ابزاری به نام GPTZero ایجاد کرده است.

برش گوشه ها: مردم به پتانسیل ChatGPT برای سوء استفاده واکنش نشان می دهند، ابزارهای جدیدی را برای دستگیری متقلبان و مطالب سرقت ادبی توسعه می دهند. یک دانش آموز ابزاری را توسعه داده است که می تواند به طور بالقوه (و به سرعت) کشف کند که چه زمانی یک متن توسط هوش مصنوعی به جای نویسنده انسانی ایجاد شده است.

تیان تعطیلات زمستانی خود را صرف توسعه پلتفرمی کرد که می توانست تشخیص دهد آیا یک انسان یا الگوریتم ChatGPT یک مقاله خاص را ایجاد کرده است. GPTZero که هنوز در مرحله بتا است، از دو نشانگر متفاوت «گیج» و «انفجار» برای شناسایی گزیده‌های متنی ساخته‌شده یا مبتنی بر هوش مصنوعی استفاده می‌کند. تیان می‌گوید ما «لایق آن هستیم که بدانیم» وقتی یک متن توسط یک مغز خودآگاه یا توسط یک الگوریتم رایانه ایجاد شده است.

به نظر می‌رسد این ابزار حداقل تا حدودی مؤثر است و برای بسیاری از متخصصانی که با متن کار می‌کنند بسیار جالب است: پس از انتشار آنلاین در 2 ژانویه، GPTZero بیش از 7 میلیون بازدیدکننده داشته و بیش از 30000 نفر از آن استفاده کرده‌اند. آنقدر محبوب بود که این سرویس از کار افتاد و پلتفرم رایگانی که در حال حاضر کد را میزبانی می کرد، تحت فشار قرار داد تا از Tian با منابع سرور بیشتر برای مدیریت بهتر ترافیک افزایش یافته اینترنت پشتیبانی کند.

بخونید:  Windows 11 is getting a redesigned Settings homepage and new backup app

تیان در توییتر توضیح داد او می‌خواست برای جلوگیری از سرقت ادبی مبتنی بر هوش مصنوعی کاری انجام دهد، و کمی نور و شفافیت را به فناوری جعبه سیاهی که هوش مصنوعی مبتنی بر آن است، بیاورد. تیان گفت: «ما واقعاً نمی‌دانیم در داخل چه می‌گذرد» الگوریتم‌های ChatGPT، و GPTZero برای مبارزه با این رویکرد طراحی شده است.





منبع در اینجا یک نسخه ی نمایشی سریع با “قاب مرجع” جان مکفی است pic.twitter.com/WphxfxxFdr

— ادوارد تیان (@edward_the6) 3 ژانویه 2023

از سوی دیگر، burstiness، تنوع جملات را می سنجد. انسان‌ها تمایل دارند با جملات طولانی‌تر یا پیچیده‌تر در کنار جملات کوتاه‌تر بنویسند. جملات هوش مصنوعی معمولا یکنواخت تر هستند، که یک هشدار قرمز برای متن احتمالی تولید شده است. تیان اذعان می‌کند که GPTZero کامل یا بی‌خطا نیست، اما این سیستم در واقع می‌تواند نتایج سریعی را برای آزمایش سرقت ادبی ارائه دهد.

گیجی پیچیدگی متن را می سنجد، یا بهتر بگوییم چقدر GPTZero توسط متن “گیج” شده است: سطح گیجی بالاتر نشان دهنده سطح بالایی از پیچیدگی متن است، به این معنی که گزیده احتمالاً توسط یک انسان نوشته شده است. هنگامی که گیجی کم است، GPTZero احتمالاً الگوهای متنی را پیدا کرده است که با آنها آشناتر است – به این معنی که متن به احتمال زیاد توسط هوش مصنوعی تولید شده است.