شرکت Glass Imaging با معرفی تکنولوژی انقلابی «Neural ISP» در گوشی جدید آنر ۶۰۰، وعده دیرینه خود مبنی بر دگرگونی عکاسی موبایل را محقق کرد. این فناوری که بر پایه هوش مصنوعی توسعه یافته، بدون نیاز به لنزهای تله‌فوتوی حجیم، جزئیات خیره‌کننده‌ای را در هنگام زوم بازیابی می‌کند.

   Jeremy Gray

تکنولوژی جدید پردازش عصبی سیگنال‌های تصویری (Neural ISP) که توسط شرکت Glass Imaging توسعه یافته، به عنوان یکی از ویژگی‌های کلیدی در گوشی جدید Honor 600 به کار گرفته شده است. این فناوری نویدبخش بهبود چشمگیر تجربه عکاسی با زوم در گوشی‌های هوشمندی است که از حسگرهای کوچک استفاده می‌کنند.

Glass Imaging دقیقاً چه می‌کند؟

تمرکز اصلی این شرکت کالیفرنیایی بر استفاده از هوش مصنوعی و پردازش هوشمندانه سیگنال‌های تصویری (ISP) برای بهبود کیفیت عکس در حسگرهای کوچک موبایل است. با بهره‌گیری از الگوریتم‌های پیچیده و توان پردازشی داخل دستگاه، GlassAI به گوشی‌های هوشمند کمک می‌کند تا بر محدودیت‌های فیزیکی ناشی از لنزها و حسگرهای کوچک غلبه کنند.

Honor 600 | Credit: Honor

Honor 600 | منبع: Honor

 

در گوشی آنر ۶۰۰، این فناوری بر روی پردازش تصاویر زوم تمرکز دارد تا جزئیات ظریف را بازیابی کرده، نویز را کاهش دهد و بافت و رنگ طبیعی را در تمام محدوده زوم حفظ کند.

به جای یک دوربین تله‌فوتو اختصاصی، آنر ۶۰۰ از برشی از دوربین اصلی ۲۰۰ مگاپیکسلی خود برای ارائه عکاسی «بزرگنمایی» استفاده می‌کند. | اعتبار تصویر: آنر

فراتر از یک رتوش ساده؛ بازیابی داده‌های واقعی

زیو اتار، مدیرعامل Glass Imaging، در این باره می‌گوید: «افتخار می‌کنیم که با آنر همکاری داریم و تکنولوژی Neural ISP ما در سری ۶۰۰ به کار گرفته شده است. آنر همواره استانداردهای بالایی در عکاسی موبایل دارد و ما خوشحالیم که محصولمان را در این سطح به بازار عرضه می‌کنیم.»

پایپ‌لاین معمولِ آموزشِ ISP عصبیِ Glass Imaging.

شیوانش رائو، از تیم یادگیری ماشین این شرکت، توضیح می‌دهد که مزیت اصلی این تکنولوژی در کار با پیکسل‌های بسیار کوچک است. پیکسل‌های زیر میکرون، داده‌ها را به شکلی پیچیده کدگذاری می‌کنند که پردازشگرهای (ISP) سنتی قادر به رمزگشایی آن‌ها نیستند. این اطلاعات گم نمی‌شوند، بلکه بازیابی آن‌ها سخت است.

نمونه زوم هوش مصنوعی آنر ۶۰۰

تله‌فوتو در آیفون ۱۷ — آیفون ۱۷ نیز مانند آنر ۶۰۰، فاقد دوربین تله‌فوتوی اختصاصی است. این گوشی از کراپ (بریدن) تصویر دوربین ۴۸ مگاپیکسلی «فیوژن» خود برای ارائه زوم با «کیفیت اپتیکال» استفاده می‌کند.

کراپ‌ها: آنر ۶۰۰ با GlassAI (چپ) در برابر آیفون ۱۷ (راست)

 

رائو می‌گوید: «ما با مدل‌سازی دقیق فیزیک حسگر و لنز، تخریب‌های نوری را از منبع اصلاح می‌کنیم، به جای اینکه صرفاً به حدسیات کلی متوسل شویم. در پردازشگرهای سنتی، مراحل به صورت زنجیره‌وار انجام می‌شوند و در هر مرحله بخشی از اطلاعات از دست می‌رود که مراحل بعدی هرگز نمی‌توانند آن را بازیابی کنند. اما ما تمام فرآیند (حذف نویز، شفاف‌سازی و ترکیب فریم‌ها) را به صورت موازی و مستقیم روی داده‌های خام (RAW) انجام می‌دهیم.»

Honor 600 AI zoom

 

iPhone 17

برش‌ها: آنر ۶۰۰ با GlassAI (چپ) در مقایسه با آیفون ۱۷ (راست)

 

هوش مصنوعی بدون ایجاد جلوه مصنوعی

بسیاری از عکاسان نسبت به واژه هوش مصنوعی در عکاسی بدبین هستند، چرا که اغلب منجر به نتایج غیرواقعی و اصطلاحاً «کارتونی» می‌شود. اما Glass Imaging تأکید می‌کند که مدل آن‌ها جزئیات جدید را از خود اختراع نمی‌کند، بلکه «جزئیات واقعی» را که حسگر ثبت کرده اما در پردازش‌های عادی از بین رفته‌اند، بازیابی می‌کند. این کار باعث می‌شود خروجی تصویر کاملاً طبیعی و وفادار به واقعیت باشد.

Honor 600 AI zoom

iPhone 17

Crops: Honor 600 with GlassAI (left) versus iPhone 17 (right)

جایگزینی برای لنز تله‌فوتو

در گوشی آنر ۶۰۰، به جای استفاده از یک لنز تله‌فوتوی اختصاصی، از کراپ (بریدن) حسگر اصلی ۲۰۰ مگاپیکسلی استفاده شده است. پیکسل‌های این حسگر بسیار کوچک (حدود ۰.۵۶ میکرومتر) هستند و در حالت عادی زوم، افت کیفیت و پدیده پراش نور (Diffraction) به شدت کیفیت را کاهش می‌دهد.

مطالعات کنترل‌شده نشان می‌دهد که تکنولوژی GlassAI توانسته است رزولوشن تصاویر را در این حسگرها بیش از ۵۰ درصد نسبت به پردازشگرهای سنتی بهبود ببخشد. این دستاورد به تولیدکنندگان اجازه می‌دهد حتی در گوشی‌های باریک یا تاشو که فضای کافی برای لنزهای بزرگ ندارند، کیفیت عکاسی فوق‌العاده‌ای ارائه دهند.

Honor 600 AI zoom

iPhone 17

برش تصاویر: آنر ۶۰۰ با GlassAI (سمت چپ) در برابر آیفون ۱۷ (سمت راست)

 

آینده‌ای فراتر از گوشی‌های هوشمند

اگرچه Honor 600 اولین قدم بزرگ این شرکت است، اما تکنولوژی Glass Imaging محدود به موبایل نخواهد بود. این شرکت در حال توسعه فناوری‌هایی برای گجت‌های پوشیدنی، پهپادها، صنعت خودرو و تجهیزات پزشکی است؛ هر جا که یک حسگر کوچک نیاز داشته باشد فراتر از توان فیزیکی خود عمل کند، GlassAI وارد عمل خواهد شد.

Glass Imaging توضیح می‌دهد: «در یک چارت متنی با خط‌های ترکیبی (حروف لاتین و نویسه‌های CJK)، خروجی ISP سنتی در همه پیکربندی‌ها عملاً غیرقابل خواندن است، چون آرتیفکت‌های شدید ناشی از دیموزاییکِ Hex CFA و ابیراهی‌های رنگیِ اصلاح‌نشده ایجاد می‌شود. اما ISP عصبی، متنِ خوانا را در سراسر بازه کاملِ گام (Pitch) بازیابی می‌کند و هرچه گام کوچک‌تر می‌شود، رندر متن به‌تدریج شارپ‌تر می‌شود.»

 

Glass Imaging می‌گوید: «در الگوهای خطوط همگرا، تراکم پیکسلی بالاتر در هر دو حالت به تفکیک خطوط ظریف‌تر کمک می‌کند. با این حال، ISP سنتی در اندازه‌های کوچک‌تر پیکسل همچنان اثرات موآره را نشان می‌دهد. ISP عصبی به لطف دیکانولوشن آگاه از PSF، الگوهای خطی را به‌صورت تمیز تفکیک می‌کند و در اندازه ۰.۳۵ میکرومتر، جزئیات ظریف‌تری نسبت به ۰.۷۵ میکرومتر به‌وضوح حفظ می‌شود.»

 

 

منبع: https://petapixel.com/

مترجم: ریحانه تقی یاری