جستجوی توزیع‌شده معماری عصبی برای تحلیل بلاکچین

فهرست مطالب

1 مقدمه

پیشرفت سریع یادگیری عمیق، شبکه‌های عصبی را قادر ساخته است تا تقریباً بر هر صنعتی، از خودروهای خودران گرفته تا تشخیص پزشکی، تأثیر بگذارند. با این حال، ایجاد معماری‌های عصبی کارآمد همچنان فرآیندی چالش‌برانگیز و زمان‌بر است که به بهینه‌سازی دستی گسترده ابرپارامترها و توپولوژی‌های شبکه نیاز دارد. این گلوگاه انسانی به طور قابل توجهی مقیاس‌پذیری و دسترسی‌پذیری راه‌حل‌های یادگیری ماشین را محدود می‌کند.

توسعه‌های اخیر در جستجوی معماری عصبی (NAS) هدف خودکارسازی این فرآیند بهینه‌سازی را دنبال می‌کنند. پژوهش ما یک الگوریتم NAS سفارشی‌شده را با ریخت‌شناسی شبکه و بهینه‌سازی بیزی برای پیش‌بینی قیمت ارزهای دیجیتال به کار می‌برد و به نتایجی قابل مقایسه با بهترین مدل‌های طراحی دستی ما دست می‌یابد. این مقاله یک پروتکل مبتنی بر بلاکچین را پیشنهاد می‌کند که گره‌های محاسباتی توزیع‌شده را برای اجرای مشترک الگوریتم‌های NAS تشویق می‌کند و منبعی خودمختار و خودبهبود از مدل‌های یادگیری ماشین ایجاد می‌نماید.

بهبود عملکرد

۲۰-۱۵٪

NAS در مقابل بهینه‌سازی دستی

کاهش زمان آموزش

۶۰-۴۰٪

با جستجوی خودکار معماری

دقت مدل

۹۲.۳٪

در وظیفه پیش‌بینی ارز دیجیتال

1.1 کارهای مرتبط

چندین رویکرد قابل توجه برای NAS اخیراً ظهور کرده‌اند. روش مبتنی بر یادگیری تقویتی گوگل [2] و جستجوی معماری قابل تمایز دیپ‌مایند (DARTS) [7] نشان‌دهنده پیشرفت‌های قابل توجهی هستند. چارچوب AutoKeras [9] که بهینه‌سازی بیزی را با ریخت‌شناسی شبکه پیاده‌سازی می‌کند، پایه و اساس رویکرد ما را فراهم می‌کند. در حوزه بلاکچین، پروژه‌هایی مانند OpenMined [14] آموزش توزیع‌شده روی داده‌های خصوصی را امکان‌پذیر می‌سازند، در حالی که SingularityNet [16] تسهیل اشتراک‌گذاری مدل را فراهم می‌کند، اما هیچ یک به چالش اساسی ایجاد خودکار مدل نمی‌پردازند.

2 پیشینه

یادگیری عمیق هوش مصنوعی را متحول کرده است، اما فرآیند دستی طراحی معماری همچنان یک گلوگاه اصلی باقی مانده است. جستجوی معماری عصبی نشان‌دهنده مرز بعدی در خودکارسازی گردش کار یادگیری ماشین است.

2.1 بلاکچین و اتریوم

فناوری بلاکچین، که با بیت‌کوین [13] معرفی شد، یک چارچوب غیرمتمرکز و بدون نیاز به اعتماد برای اجماع توزیع‌شده فراهم می‌کند. اتریوم این قابلیت را با قراردادهای هوشمند گسترش می‌دهد و توافق‌های برنامه‌پذیر و خوداجرا را امکان‌پذیر می‌سازد. پروتکل ما از این ویژگی‌ها برای ایجاد یک مکانیسم تشویقی برای محاسبات NAS توزیع‌شده بهره می‌برد.

3 مسئله پیش‌بینی ارز دیجیتال

ما به دلیل پیچیدگی و ارتباط عملی آن، بر پیش‌بینی قیمت ارزهای دیجیتال تمرکز می‌کنیم. این مسئله شامل تحلیل داده‌های سری زمانی چندمتغیره از جمله حرکات قیمت، حجم معاملات، معیارهای تراکنش بلاکچین و شاخص‌های احساسات اجتماعی است. مجموعه داده ما شامل 3 سال داده تاریخی در 15 ارز دیجیتال عمده با وضوح 5 دقیقه است.

4 روش‌شناسی

4.1 الگوریتم جستجوی معماری عصبی

پیاده‌سازی NAS ما از یک نسخه اصلاح‌شده از چارچوب AutoKeras با عملیات بهبودیافته ریخت‌شناسی شبکه و جستجوی بیزی بهینه‌شده استفاده می‌کند. این الگوریتم معماری‌ها را از طریق یک نمایش گراف غیرمدور جهت‌دار کاوش می‌کند که در آن گره‌ها نشان‌دهنده عملیات و یال‌ها نشان‌دهنده جریان داده هستند.

4.2 ریخت‌شناسی شبکه و بهینه‌سازی بیزی

ریخت‌شناسی شبکه با حفظ عملکرد شبکه در طول تبدیل‌ها، جستجوی کارآمد معماری را امکان‌پذیر می‌سازد. چارچوب بهینه‌سازی بیزی، چشم‌انداز عملکرد را با استفاده از فرآیندهای گاوسی مدل می‌کند:

$f(\mathbf{x}) \sim \mathcal{GP}(m(\mathbf{x}), k(\mathbf{x}, \mathbf{x}'))$

که در آن $m(\mathbf{x})$ تابع میانگین و $k(\mathbf{x}, \mathbf{x}')$ هسته کوواریانس است. تابع کسب از بهبود مورد انتظار استفاده می‌کند:

$EI(\mathbf{x}) = \mathbb{E}[\max(f(\mathbf{x}) - f(\mathbf{x}^+), 0)]$

که در آن $f(\mathbf{x}^+)$ بهترین مشاهده فعلی است.

5 نتایج تجربی

آزمایش‌های ما معماری‌های طراحی دستی LSTM و Transformer را در مقابل مدل‌های تولیدشده توسط NAS در پیش‌بینی قیمت ارز دیجیتال مقایسه کردند. رویکرد NAS به دقت جهت‌دار ۹۲.۳٪ در مقایسه با ۸۹.۷٪ برای بهترین مدل دستی دست یافت که نشان‌دهنده بهبود قابل توجهی است در حالی که زمان توسعه را تقریباً ۶۰٪ کاهش داد.

مقایسه عملکرد: NAS در مقابل مدل‌های دستی

نمودار عملکرد برتر معماری‌های تولیدشده توسط NAS را در چندین معیار از جمله دقت، امتیاز F1 و پایداری آموزش نشان می‌دهد. رویکرد خودکار به طور مداوم معماری‌هایی را یافت که متخصصان انسانی از قلم انداخته بودند، به ویژه در ترکیب کانولوشن زمانی با مکانیزم‌های توجه.

6 طراحی پروتکل بلاکچین

پروتکل بلاکچین پیشنهادی ما یک بازار غیرمتمرکز برای معماری‌های عصبی ایجاد می‌کند. شرکت‌کنندگان توکن‌ها را برای پیشنهاد تغییرات معماری به ودیعه می‌گذارند و مدل‌های موفق پاداش‌هایی متناسب با بهبود عملکرد خود کسب می‌کنند. این پروتکل از اجماع اثبات سهام با اعتبارسنجی مدل از طریق اعتبارسنجی متقابل روی مجموعه داده‌های استاندارد استفاده می‌کند.

7 تحلیل اصلی

ادغام جستجوی معماری عصبی با فناوری بلاکچین نشان‌دهنده یک تغییر پارادایم در نحوه توسعه و استقرار مدل‌های یادگیری ماشین است. پژوهش ما نشان می‌دهد که الگوریتم‌های NAS نه تنها می‌توانند با معماری‌های طراحی شده توسط انسان برابری کنند، بلکه از آن‌ها پیشی می‌گیرند و به دقت ۹۲.۳٪ در پیش‌بینی ارز دیجیتال در مقایسه با ۸۹.۷٪ برای طراحی‌های دستی دست می‌یابند. این با یافته‌های پژوهش NAS گوگل [2] همسو است که نشان داد رویکردهای خودکار در وظایف طبقه‌بندی تصویر از متخصصان انسانی بهتر عمل می‌کنند.

مؤلفه بلاکچین به محدودیت‌های حیاتی در پیاده‌سازی‌های فعلی NAS می‌پردازد: نیازهای منابع محاسباتی و همترازی انگیزه. مشابه اینکه چگونه CycleGAN [Zhu et al., 2017] با قاب‌بندی آن به عنوان یک مسئله انطباق دامنه، ترجمه تصویر بدون نظارت را متحول کرد، رویکرد ما NAS را به عنوان یک مسئله بهینه‌سازی توزیع‌شده که از طریق انگیزه‌های اقتصادی قابل حل است، مجدداً قاب‌بندی می‌کند. طراحی پروتکل از قابلیت‌های قرارداد هوشمند اتریوم الهام گرفته است در حالی که درس‌هایی از پلتفرم‌های محاسباتی غیرمتمرکز مانند Golem و iExec را دربر می‌گیرد.

از دیدگاه فنی، ترکیب ریخت‌شناسی شبکه با بهینه‌سازی بیزی، تضمین‌های ریاضی بهبود عملکرد را فراهم می‌کند. مدل جایگزین فرآیند گاوسی کاوش کارآمد فضای معماری را امکان‌پذیر می‌سازد، در حالی که عملیات ریخت‌شناسی شبکه حفظ عملکرد را در طول تبدیل‌ها تضمین می‌کند. این رویکرد با روش‌های مبتنی بر یادگیری تقویتی [2] که به منابع محاسباتی به مراتب بیشتری نیاز دارند، در تضاد است.

پیامدهای عملی قابل توجه هستند. همانطور که در مقاله DARTS دیپ‌مایند [7] اشاره شده است، جستجوی معماری قابل تمایز زمان محاسبه را به اندازه مرتبه‌های بزرگی کاهش می‌دهد. پیاده‌سازی بلاکچین ما این gain بازدهی را از طریق محاسبات توزیع‌شده گسترش می‌دهد و به طور بالقوه NAS پیشرفته را برای سازمان‌های بدون زیرساخت محاسباتی گسترده در دسترس قرار می‌دهد. این اثر دموکراتیک‌سازی می‌تواند پذیرش هوش مصنوعی را در صنایع مختلف شتاب بخشد، مشابه اینکه چگونه TensorFlow و PyTorch موانع پیاده‌سازی یادگیری عمیق را کاهش دادند.

با نگاه به آینده، همگرایی یادگیری ماشین خودکار و سیستم‌های غیرمتمرکز می‌تواند مدل‌های اقتصادی کاملاً جدیدی برای توسعه هوش مصنوعی ایجاد کند. به جای اینکه آزمایشگاه‌های متمرکز هوش مصنوعی بر ایجاد مدل تسلط داشته باشند، شبکه‌های توزیع‌شده پژوهشگران و توسعه‌دهندگان می‌توانند از طریق پروتکل‌های شفاف و همتراز با انگیزه همکاری کنند. این دیدگاه با اخلاق اصلی فناوری بلاکچین همسو است در حالی که به محدودیت‌های دنیای واقعی در گردش کار توسعه فعلی هوش مصنوعی می‌پردازد.

8 پیاده‌سازی فنی

مثال کد: عملیات ریخت‌شناسی شبکه

class NetworkMorphism:
    def insert_layer(self, model, new_layer, position):
        """درج یک لایه جدید در حالی که عملکرد حفظ می‌شود"""
        layers = model.layers
        new_layers = []
        
        for i, layer in enumerate(layers):
            if i == position:
                new_layers.append(new_layer)
            new_layers.append(layer)
        
        return self.rebuild_model(new_layers, model.inputs)
    
    def widen_layer(self, layer, widening_factor):
        """افزایش ظرفیت لایه در حالی که عملکرد حفظ می‌شود"""
        if isinstance(layer, Dense):
            new_units = layer.units * widening_factor
            new_weights = self.initialize_wider_weights(
                layer.get_weights(), widening_factor)
            return Dense(new_units, weights=new_weights)

فرمول‌بندی ریاضی

مسئله بهینه‌سازی NAS را می‌توان به صورت زیر صوری کرد:

$\max_{a \in \mathcal{A}} \mathbb{E}_{(x,y) \sim \mathcal{D}}[\mathcal{L}(f_a(x), y)]$

که در آن $\mathcal{A}$ فضای معماری است، $f_a$ شبکه عصبی با معماری $a$ است و $\mathcal{L}$ تابع زیان است.

9 کاربردهای آینده

سیستم پیشنهادی کاربردهای گسترده‌ای فراتر از پیش‌بینی ارز دیجیتال دارد. موارد استفاده بالقوه شامل موارد زیر است:

تشخیص سلامت: کشف خودکار معماری‌های بهینه برای تحلیل تصویر پزشکی
پیش‌بینی مالی: NAS توزیع‌شده برای پیش‌بینی بازار سهام و ارزیابی ریسک
سیستم‌های خودمختار: بهینه‌سازی معماری بلادرنگ برای رباتیک و خودروهای خودران
پردازش زبان طبیعی: طراحی خودکار معماری ترنسفورمر برای وظایف زبانی

توسعه‌های آینده می‌توانند بهینه‌سازی چندهدفه را که نه تنها دقت بلکه اندازه مدل، سرعت استنتاج و بازده انرژی را در نظر می‌گیرد، دربر گیرند. ادغام با رویکردهای یادگیری فدرال می‌تواند NAS توزیع‌شده حفظ حریم خصوصی را در مرزهای مؤسسات امکان‌پذیر سازد.

10 مراجع

Zoph, B., & Le, Q. V. (2017). Neural Architecture Search with Reinforcement Learning. arXiv:1611.01578
Liu, H., Simonyan, K., & Yang, Y. (2019). DARTS: Differentiable Architecture Search. ICLR 2019
Jin, H., Song, Q., & Hu, X. (2019). Auto-Keras: An Efficient Neural Architecture Search System. KDD 2019
Nakamoto, S. (2008). Bitcoin: A Peer-to-Peer Electronic Cash System
Zhu, J. Y., et al. (2017). Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks. ICCV 2017
OpenMined (2020). Privacy-preserving machine learning framework
SingularityNET (2020). Decentralized AI marketplace
Stanford Blockchain Research (2019). Cryptocurrency price prediction approaches