فهرست مطالب
1 مقدمه
پیشرفت سریع یادگیری عمیق، شبکههای عصبی را قادر ساخته است تا تقریباً بر هر صنعتی، از خودروهای خودران گرفته تا تشخیص پزشکی، تأثیر بگذارند. با این حال، ایجاد معماریهای عصبی کارآمد همچنان فرآیندی چالشبرانگیز و زمانبر است که به بهینهسازی دستی گسترده ابرپارامترها و توپولوژیهای شبکه نیاز دارد. این گلوگاه انسانی به طور قابل توجهی مقیاسپذیری و دسترسیپذیری راهحلهای یادگیری ماشین را محدود میکند.
توسعههای اخیر در جستجوی معماری عصبی (NAS) هدف خودکارسازی این فرآیند بهینهسازی را دنبال میکنند. پژوهش ما یک الگوریتم NAS سفارشیشده را با ریختشناسی شبکه و بهینهسازی بیزی برای پیشبینی قیمت ارزهای دیجیتال به کار میبرد و به نتایجی قابل مقایسه با بهترین مدلهای طراحی دستی ما دست مییابد. این مقاله یک پروتکل مبتنی بر بلاکچین را پیشنهاد میکند که گرههای محاسباتی توزیعشده را برای اجرای مشترک الگوریتمهای NAS تشویق میکند و منبعی خودمختار و خودبهبود از مدلهای یادگیری ماشین ایجاد مینماید.
بهبود عملکرد
۲۰-۱۵٪
NAS در مقابل بهینهسازی دستی
کاهش زمان آموزش
۶۰-۴۰٪
با جستجوی خودکار معماری
دقت مدل
۹۲.۳٪
در وظیفه پیشبینی ارز دیجیتال
1.1 کارهای مرتبط
چندین رویکرد قابل توجه برای NAS اخیراً ظهور کردهاند. روش مبتنی بر یادگیری تقویتی گوگل [2] و جستجوی معماری قابل تمایز دیپمایند (DARTS) [7] نشاندهنده پیشرفتهای قابل توجهی هستند. چارچوب AutoKeras [9] که بهینهسازی بیزی را با ریختشناسی شبکه پیادهسازی میکند، پایه و اساس رویکرد ما را فراهم میکند. در حوزه بلاکچین، پروژههایی مانند OpenMined [14] آموزش توزیعشده روی دادههای خصوصی را امکانپذیر میسازند، در حالی که SingularityNet [16] تسهیل اشتراکگذاری مدل را فراهم میکند، اما هیچ یک به چالش اساسی ایجاد خودکار مدل نمیپردازند.
2 پیشینه
یادگیری عمیق هوش مصنوعی را متحول کرده است، اما فرآیند دستی طراحی معماری همچنان یک گلوگاه اصلی باقی مانده است. جستجوی معماری عصبی نشاندهنده مرز بعدی در خودکارسازی گردش کار یادگیری ماشین است.
2.1 بلاکچین و اتریوم
فناوری بلاکچین، که با بیتکوین [13] معرفی شد، یک چارچوب غیرمتمرکز و بدون نیاز به اعتماد برای اجماع توزیعشده فراهم میکند. اتریوم این قابلیت را با قراردادهای هوشمند گسترش میدهد و توافقهای برنامهپذیر و خوداجرا را امکانپذیر میسازد. پروتکل ما از این ویژگیها برای ایجاد یک مکانیسم تشویقی برای محاسبات NAS توزیعشده بهره میبرد.
3 مسئله پیشبینی ارز دیجیتال
ما به دلیل پیچیدگی و ارتباط عملی آن، بر پیشبینی قیمت ارزهای دیجیتال تمرکز میکنیم. این مسئله شامل تحلیل دادههای سری زمانی چندمتغیره از جمله حرکات قیمت، حجم معاملات، معیارهای تراکنش بلاکچین و شاخصهای احساسات اجتماعی است. مجموعه داده ما شامل 3 سال داده تاریخی در 15 ارز دیجیتال عمده با وضوح 5 دقیقه است.
4 روششناسی
4.1 الگوریتم جستجوی معماری عصبی
پیادهسازی NAS ما از یک نسخه اصلاحشده از چارچوب AutoKeras با عملیات بهبودیافته ریختشناسی شبکه و جستجوی بیزی بهینهشده استفاده میکند. این الگوریتم معماریها را از طریق یک نمایش گراف غیرمدور جهتدار کاوش میکند که در آن گرهها نشاندهنده عملیات و یالها نشاندهنده جریان داده هستند.
4.2 ریختشناسی شبکه و بهینهسازی بیزی
ریختشناسی شبکه با حفظ عملکرد شبکه در طول تبدیلها، جستجوی کارآمد معماری را امکانپذیر میسازد. چارچوب بهینهسازی بیزی، چشمانداز عملکرد را با استفاده از فرآیندهای گاوسی مدل میکند:
$f(\mathbf{x}) \sim \mathcal{GP}(m(\mathbf{x}), k(\mathbf{x}, \mathbf{x}'))$
که در آن $m(\mathbf{x})$ تابع میانگین و $k(\mathbf{x}, \mathbf{x}')$ هسته کوواریانس است. تابع کسب از بهبود مورد انتظار استفاده میکند:
$EI(\mathbf{x}) = \mathbb{E}[\max(f(\mathbf{x}) - f(\mathbf{x}^+), 0)]$
که در آن $f(\mathbf{x}^+)$ بهترین مشاهده فعلی است.
5 نتایج تجربی
آزمایشهای ما معماریهای طراحی دستی LSTM و Transformer را در مقابل مدلهای تولیدشده توسط NAS در پیشبینی قیمت ارز دیجیتال مقایسه کردند. رویکرد NAS به دقت جهتدار ۹۲.۳٪ در مقایسه با ۸۹.۷٪ برای بهترین مدل دستی دست یافت که نشاندهنده بهبود قابل توجهی است در حالی که زمان توسعه را تقریباً ۶۰٪ کاهش داد.
مقایسه عملکرد: NAS در مقابل مدلهای دستی
نمودار عملکرد برتر معماریهای تولیدشده توسط NAS را در چندین معیار از جمله دقت، امتیاز F1 و پایداری آموزش نشان میدهد. رویکرد خودکار به طور مداوم معماریهایی را یافت که متخصصان انسانی از قلم انداخته بودند، به ویژه در ترکیب کانولوشن زمانی با مکانیزمهای توجه.
6 طراحی پروتکل بلاکچین
پروتکل بلاکچین پیشنهادی ما یک بازار غیرمتمرکز برای معماریهای عصبی ایجاد میکند. شرکتکنندگان توکنها را برای پیشنهاد تغییرات معماری به ودیعه میگذارند و مدلهای موفق پاداشهایی متناسب با بهبود عملکرد خود کسب میکنند. این پروتکل از اجماع اثبات سهام با اعتبارسنجی مدل از طریق اعتبارسنجی متقابل روی مجموعه دادههای استاندارد استفاده میکند.
7 تحلیل اصلی
ادغام جستجوی معماری عصبی با فناوری بلاکچین نشاندهنده یک تغییر پارادایم در نحوه توسعه و استقرار مدلهای یادگیری ماشین است. پژوهش ما نشان میدهد که الگوریتمهای NAS نه تنها میتوانند با معماریهای طراحی شده توسط انسان برابری کنند، بلکه از آنها پیشی میگیرند و به دقت ۹۲.۳٪ در پیشبینی ارز دیجیتال در مقایسه با ۸۹.۷٪ برای طراحیهای دستی دست مییابند. این با یافتههای پژوهش NAS گوگل [2] همسو است که نشان داد رویکردهای خودکار در وظایف طبقهبندی تصویر از متخصصان انسانی بهتر عمل میکنند.
مؤلفه بلاکچین به محدودیتهای حیاتی در پیادهسازیهای فعلی NAS میپردازد: نیازهای منابع محاسباتی و همترازی انگیزه. مشابه اینکه چگونه CycleGAN [Zhu et al., 2017] با قاببندی آن به عنوان یک مسئله انطباق دامنه، ترجمه تصویر بدون نظارت را متحول کرد، رویکرد ما NAS را به عنوان یک مسئله بهینهسازی توزیعشده که از طریق انگیزههای اقتصادی قابل حل است، مجدداً قاببندی میکند. طراحی پروتکل از قابلیتهای قرارداد هوشمند اتریوم الهام گرفته است در حالی که درسهایی از پلتفرمهای محاسباتی غیرمتمرکز مانند Golem و iExec را دربر میگیرد.
از دیدگاه فنی، ترکیب ریختشناسی شبکه با بهینهسازی بیزی، تضمینهای ریاضی بهبود عملکرد را فراهم میکند. مدل جایگزین فرآیند گاوسی کاوش کارآمد فضای معماری را امکانپذیر میسازد، در حالی که عملیات ریختشناسی شبکه حفظ عملکرد را در طول تبدیلها تضمین میکند. این رویکرد با روشهای مبتنی بر یادگیری تقویتی [2] که به منابع محاسباتی به مراتب بیشتری نیاز دارند، در تضاد است.
پیامدهای عملی قابل توجه هستند. همانطور که در مقاله DARTS دیپمایند [7] اشاره شده است، جستجوی معماری قابل تمایز زمان محاسبه را به اندازه مرتبههای بزرگی کاهش میدهد. پیادهسازی بلاکچین ما این gain بازدهی را از طریق محاسبات توزیعشده گسترش میدهد و به طور بالقوه NAS پیشرفته را برای سازمانهای بدون زیرساخت محاسباتی گسترده در دسترس قرار میدهد. این اثر دموکراتیکسازی میتواند پذیرش هوش مصنوعی را در صنایع مختلف شتاب بخشد، مشابه اینکه چگونه TensorFlow و PyTorch موانع پیادهسازی یادگیری عمیق را کاهش دادند.
با نگاه به آینده، همگرایی یادگیری ماشین خودکار و سیستمهای غیرمتمرکز میتواند مدلهای اقتصادی کاملاً جدیدی برای توسعه هوش مصنوعی ایجاد کند. به جای اینکه آزمایشگاههای متمرکز هوش مصنوعی بر ایجاد مدل تسلط داشته باشند، شبکههای توزیعشده پژوهشگران و توسعهدهندگان میتوانند از طریق پروتکلهای شفاف و همتراز با انگیزه همکاری کنند. این دیدگاه با اخلاق اصلی فناوری بلاکچین همسو است در حالی که به محدودیتهای دنیای واقعی در گردش کار توسعه فعلی هوش مصنوعی میپردازد.
8 پیادهسازی فنی
مثال کد: عملیات ریختشناسی شبکه
class NetworkMorphism:
def insert_layer(self, model, new_layer, position):
"""درج یک لایه جدید در حالی که عملکرد حفظ میشود"""
layers = model.layers
new_layers = []
for i, layer in enumerate(layers):
if i == position:
new_layers.append(new_layer)
new_layers.append(layer)
return self.rebuild_model(new_layers, model.inputs)
def widen_layer(self, layer, widening_factor):
"""افزایش ظرفیت لایه در حالی که عملکرد حفظ میشود"""
if isinstance(layer, Dense):
new_units = layer.units * widening_factor
new_weights = self.initialize_wider_weights(
layer.get_weights(), widening_factor)
return Dense(new_units, weights=new_weights)
فرمولبندی ریاضی
مسئله بهینهسازی NAS را میتوان به صورت زیر صوری کرد:
$\max_{a \in \mathcal{A}} \mathbb{E}_{(x,y) \sim \mathcal{D}}[\mathcal{L}(f_a(x), y)]$
که در آن $\mathcal{A}$ فضای معماری است، $f_a$ شبکه عصبی با معماری $a$ است و $\mathcal{L}$ تابع زیان است.
9 کاربردهای آینده
سیستم پیشنهادی کاربردهای گستردهای فراتر از پیشبینی ارز دیجیتال دارد. موارد استفاده بالقوه شامل موارد زیر است:
- تشخیص سلامت: کشف خودکار معماریهای بهینه برای تحلیل تصویر پزشکی
- پیشبینی مالی: NAS توزیعشده برای پیشبینی بازار سهام و ارزیابی ریسک
- سیستمهای خودمختار: بهینهسازی معماری بلادرنگ برای رباتیک و خودروهای خودران
- پردازش زبان طبیعی: طراحی خودکار معماری ترنسفورمر برای وظایف زبانی
توسعههای آینده میتوانند بهینهسازی چندهدفه را که نه تنها دقت بلکه اندازه مدل، سرعت استنتاج و بازده انرژی را در نظر میگیرد، دربر گیرند. ادغام با رویکردهای یادگیری فدرال میتواند NAS توزیعشده حفظ حریم خصوصی را در مرزهای مؤسسات امکانپذیر سازد.
10 مراجع
- Zoph, B., & Le, Q. V. (2017). Neural Architecture Search with Reinforcement Learning. arXiv:1611.01578
- Liu, H., Simonyan, K., & Yang, Y. (2019). DARTS: Differentiable Architecture Search. ICLR 2019
- Jin, H., Song, Q., & Hu, X. (2019). Auto-Keras: An Efficient Neural Architecture Search System. KDD 2019
- Nakamoto, S. (2008). Bitcoin: A Peer-to-Peer Electronic Cash System
- Zhu, J. Y., et al. (2017). Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks. ICCV 2017
- OpenMined (2020). Privacy-preserving machine learning framework
- SingularityNET (2020). Decentralized AI marketplace
- Stanford Blockchain Research (2019). Cryptocurrency price prediction approaches