Calligrapher.ai از هوش مصنوعی برای تولید دست خط استفاده می کند

Calligrapher.ai می تواند دستخط متغیر را در 9 سبک مختلف تولید کند، در حالی که کاربران می توانند لغزنده های سرعت، خوانایی و عرض ضربه را برای سفارشی سازی بیشتر تغییر دهند. برخلاف انواع فونت های سنتی که برای تقلید از دست خط طراحی شده اند، هر نمونه تولید شده توسط Calligrapher.ai باید منحصر به فرد باشد حتی زمانی که سبک نوشتن یکسان است. کاربران می توانند نتیجه نهایی را به صورت فایل برداری SVG دانلود کنند.

به گفته Vasquez، نوار لغزنده خوانایی از روشی به نام “تنظیم دمای توزیع نمونه برداری” برای تغییر تنوع در دست خط استفاده می کند. خروجی ها از یک “توزیع احتمال” می آیند و افزایش خوانایی “به طور موثر تراکم احتمال را حول نتایج محتمل تر متمرکز می کند.”

سال‌ها قبل از اینکه OpenAI و سایر سازمان‌ها شروع به بازی با هوش مصنوعی برای تولید آسان متن، گفتار، آثار هنری، بدافزار و ویدیو کنند، شان واسکوئز، محقق یادگیری ماشین، در حال مطالعه مقاله‌ای در سال 2013 توسط الکس گریوز از Google DeepMind برای ایجاد آزمایش‌های «ترکیب دست‌نویس» بود.

در متن: محققان دنیای خلاق را وارونه می کنند و از هوش مصنوعی و الگوریتم های یادگیری ماشین برای تبدیل بسیاری از وظایف به فرآیندهای نیمه مستقل استفاده می کنند. دیگر هیچ چیز از هوش مصنوعی مولد در امان نیست، حتی نوشته ناخوانا پزشک محلی شما.

Vasquez کد خود را همراه با نسخه نمایشی مبتنی بر وب خود در GitHub بایگانی کرد. این آزمایش در Calligrapher.ai در دسترس است که هکر نیوز اخیرا آن را دوباره کشف کرده است. سنتز دست خط پشت Calligrapher.ai از یک روش مولد ساخته شده بر اساس یک شبکه عصبی بازگشتی (RNN) استفاده می کند.

یک RNN کلاسی از شبکه‌های عصبی مصنوعی است که در آن اتصالات بین گره‌ها می‌تواند چرخه‌ای ایجاد کند که به خروجی برخی از گره‌ها اجازه می‌دهد بر ورودی بعدی به همان گره‌ها تأثیر بگذارد. شبکه‌های عصبی مکرر می‌توانند رفتار دینامیکی زمانی از خود نشان دهند، که آنها را به ویژه در کارهایی مانند دست خط یا تشخیص گفتار مفید می‌کند. مانند هر شبکه عصبی دیگری، Vasquez Calligrapher.ai را بر روی مجموعه داده نسبتاً بزرگی از نمونه‌های خوشنویسی، عمدتاً پایگاه داده‌های دست خط IAM On-Line آموزش داد.

Calligrapher.ai که فقط یک نسخه نمایشی است، علیرغم توانایی آن در ایجاد الگوهای دستخط باورپذیر، از نظر دامنه محدود است. علاوه بر این، Vasquez فقط RNN زیربنایی را بر روی نمونه‌های زبان انگلیسی آموزش داد، بنابراین وب‌سایت در بازتولید لهجه‌هایی که معمولاً در زبان‌های دیگر استفاده می‌شود، خوب نیست.



منبع

پایگاه داده IAM-On حاوی «فرم‌هایی از متن انگلیسی دست‌نویسی است که روی تخته سفید به دست آمده‌اند»، با نمونه‌هایی از 221 «نویسنده» مختلف و بیش از 1700 فرم به دست آمده. پایگاه داده شامل 13049 خط متن جدا شده و برچسب‌گذاری شده در قالب‌های «آنلاین» و «خارج از خط»، برای مجموع 86272 نمونه از یک فرهنگ لغت 11059 کلمه‌ای است.