همچنین این سوال وجود دارد که آیا این نوع از خراش دادن داده ها حتی قانونی است یا خیر. OpenAI خالق ChatGPT به دلیل اتهاماتی مبنی بر اینکه اطلاعات شخصی کاربران اینترنت را به طور غیرقانونی جمع آوری کرده و از داده ها برای ایجاد محصولات خود استفاده کرده است، با شکایت قضایی مواجه است.
به روز رسانی گوگل در آخر هفته، عبارت جدیدی را به خط مشی رازداری خود معرفی کرد. قبلاً اعلام کرده بود که از دادههای افراد برای آموزش مدلهای «زبان» استفاده میشود و تنها به Google Translate اشاره میشود. نسخه به روز شده این را به «مدلهای هوش مصنوعی» تغییر میدهد، بهویژه از هوش مصنوعی Bard و Cloud در کنار Translate نام میبرد.
– حساب های تایید شده محدود به خواندن 6000 پست در روز است
– حساب های تایید نشده به 600 پست در روز
– حساب های تایید نشده جدید به 300 در روز
– ایلان ماسک (@elonmusk) 1 ژوئیه 2023
یکی از بسیاری از مسائل بحث برانگیز در مورد سیستم های هوش مصنوعی مولد مانند ChatGPT و Bard، نحوه خراش و استفاده از داده ها است. ممکن است این اطلاعات در دسترس عموم باشد، اما این نگرانیهای مربوط به سرقت ادبی و حفظ حریم خصوصی را متوقف نمیکند، نه اینکه به احتمال سوء تعبیر هوش مصنوعی از آنچه گفته شد یا ارائه پاسخهای قدیمی و قدیمی اشاره کنیم. حتی گوگل به کارمندان هشدار داده است که هنگام استفاده از ربات های چت مانند Bard خود محتاط باشند زیرا می توانند کدهای نامطلوب را پیشنهاد دهند.
Reddit همچنین از زمانی که دسترسی رایگان به API های خود را برای متوقف کردن برداشت داده ها غیرفعال کرد، با مشکلات زیادی مواجه شده است. این حرکت منجر به تاریک شدن بیش از 8000 subreddit در اعتراض شد و برخی به NSFW تغییر یافتند.