منو
 صفحه های تصادفی
اجتماع در عهد صفویه
آزمایش چادویک
خدنگ زمان
تقرب ملائکه به خدا با دوستی امام علی علیه السلام
دوره چهارم
بنی ذکوان
تولید و پخش فیلم
پاسخ حکیمانه امام هادی علیه السلام به متوکل
شواهدی از سرخ پوستان کهن
یادگیری مفاهیم
 کاربر Online
521 کاربر online
 : کامپیوتر
برای پاسخ دادن به این ارسال باید از صفحه قبلی اقدام کنید.   کاربر offline دبیر گروه کامپیوتر 3 ستاره ها ارسال ها: 1679   در :  شنبه 31 فروردین 1392 [22:49 ]
  مهندسي معكوس مغز - Reverse - Engineering the Brain
 

مدلسازي تشخيص بي‌درنگ‌
يكي از نمونه‌هاي عيني بر اظهارات مورد اشاره DiCarlo را مي‌توان در آزمايشگاه‌هاي Tomaso Poggio پيدا كرد.Poggio، يكي از مسئولان مركز يادگيري‌هاي بيولوژيكي و محاسباتي دانشگاه ام‌آي‌تي است كه چهار دهه به بررسي موضوع بينايي پرداخته است.

ضمیمه:
rv_b3.jpg

وي نخست در انستيتوي Max Planck واقع در Tubingen در آلمان و سپس در آزمايشگاه هوش مصنوعي دانشگاه ام‌آي‌تي (كه بعدها به آزمايشگاه علوم كامپيوتر و هوش مصنوعي تغيير يافت) مشغول تحقيق بوده است، و هم اكنون در بخش مغز و علومِ ادراكي به پژوهش‌هاي خود ادامه مي‌دهد. Poggio در پروژه تست ميمون Macaque كه در آغاز اين نوشته به آن اشاره شد، با DiCarlo همكاري كرده است.)


او بيشتر وقت خود را به هدايت يك گروه پژوهشي عصب‌شناسي و يك گروه پژوهشي بينايي ماشين گذرانده است و در آن زمان دليلي نمي‌ديد كه اين دو گروه را با هم تلفيق كند. او مي‌گويد: ولي نتايج اخير كه از انجام پروژه‌اي توسط Thomas Serre، فارغ التحصيل دكترا، و Aude Oliva، استاديار عصب‌شناسي ادراكي در مركز BCS به دست آمد، نظر او را تغيير داد.

آزمايشگاه Poggio هم اكنون روي يك پروژه شناسايي موسوم به شناسايي بي‌درنگ متمركز شده است. اين موضوع كمتر شناخته شده، نخستين بار در سال 1969 در يك مقاله و طي سميناري در دانشگاه ام‌آي‌تي توسط Mary Potter (استاد فعلي روان‌شناسي مركز BCS) و دستيار او Ellen Levy ارائه شد. شناسايي بي‌درنگ نوع سريع‌تري از شناسايي است. شخصي كه بايد در تست شناسايي بي‌درنگ كلاسيك مورد آزمون قرار گيرد، پيش از نمايش تصاوير روي نمايشگر و درخواست از وي براي فشار دادن يك يا دو دكمه براي واكنش نشان دادن به هر تصوير و تعيين اين‌كه آيا آن تصوير متعلق به يك حيوان است يا نه، درآنجا نشانده مي شود.

براي اطمينان از اين‌كه نگاه افراد به يك تصوير به تشخيص آن‌ها هنگام نگاه كردن به تصاوير ديگر كمك نكند، پژوهشگران از تصاويري استفاده مي‌كنند كه بسيار متفاوت از يكديگرند؛ مانند يك دسته جانور در پس‌زمينه‌هاي مختلف كه هر كدام در جهت و پرسپكتيوخاصي قرار گرفته‌اند. اين تصاوير تنها چند دهم ثانيه روي نمايشگر ظاهر مي‌شوند. در يكي از اين تست‌ها ، يكي از كساني كه مورد آزمايش قرار مي‌گرفت، تقريباً هيچ چيز از تصاويري كه به سرعت ظاهر و سپس ناپديد مي‌شدند، نفهميد؛ چه رسد به شناسايي آن. جالب اين است كه اين اشخاص بيشتر كليد درست را فشار مي‌دادند. آن‌ها مرتباً در طول آزمايش پيشرفت مي‌كنند و هشياري آن‌ها هنگام نمايش تصاوير رفته رفته بيشتر مي‌شود. مكانيسمي در مغز وجود دارد كه مي‌تواند اشيا را پيش از آن كه شخص نسبت به تصويري كه ديده است آگاه شود، شناسايي و دسته بندي كند.

شناسايي بي‌درنگ از آن جهت براي پژوهشگران حائز اهميت است كه ساده‌ترين امكان براي بررسي شناسايي عمومي اشيا است. فرآيند شناسايي بي‌درنگ چنان سريع اتفاق مي‌افتد كه موجب فعاليت تعداد بسيار زيادي از نورون‌هاي عصبي، پردازش اطلاعات بسيار يا ارسال و دريافت درخواست‌هاي زياد در يك فضاي بيش از يك سانتي‌متري در مغز مي‌شود. اطلاعات جمعآوري شده از طريق چرخش چشم به اطراف، كه در انواع ديگر شناسايي (مانند آنچه كه DiCarlo انجام داده بود) موردي كليدي محسوب مي‌شود، در شناسايي بي‌درنگ نقشي ندارد.

با اين وجود، بيشتر اشخاص مورد آزمايش در هنگام تست كليد درست را فشار مي‌دهند، كه نشان مي‌دهد نوع خاصي از شناسايي اشيا مي‌تواند با استفاده از تعداد كمي از نورون‌هاي عصبي و با آرايش ساده و نه‌چندان پيچيده نورون‌ها انجام شود.

Poggie به همراه دكتر Riesenhuber، و بعدها Grad دانشجوي سال آخر در دانشگاه ام آي‌تي و هم اكنون نيز استاد دانشگاه جورج تاون به توسعه يك تئوري درباره كاركرد بخشي از لايه بيروني مغز كه مسئول شناسايي بي‌درنگ است، پرداختند. پژوهش و نگرش آن‌ها درباره پردازش تصوير با نگرش مهندسي به بينايي ماشين متفاوت بود. براي نمونه، بيشتر نرم‌افزارهاي بينايي ماشين شامل يك پردازشگر براي اجراي مجموعه‌اي از دستورات به صورت يكي پس از ديگري و ساختاري موسوم به پردازش سريال است. از سوي ديگر، مغز از پردازش موازي استفاده مي‌كند، فرآيندي كه طي آن، به چندين بخش شكسته مي‌شود و هر بخش، جداگانه توسط پردازنده مخصوص خود بررسي مي‌شود، و پس از پردازش آن‌ها، بسته به نوع مسئله اين بخش‌ها به هم متصل و به عنوان پاسخ باز گردانده مي‌شوند.

از لحاظ تئوري، مهندسان مي‌بايست براي برنامه‌هاي بينايي ماشين از پردازش موازي استفاده كنند (گاه تلاش كرده‌اند اين كار را انجام دهند)، ولي در عمل شكستن يك سؤال به چند بخش و اتصال دوباره آن‌ها به هم، به ندرت انجام مي‌شود. با اين حال بينايي بيولوژيكي (Biological vision) اين مشكل را به چند طريق مختلف مرتفع كرده است. يكي از آن راه‌ها به گفته گروه Poggio، سازماندهي و كنترل پردازش است. به‌گونه‌اي كه پردازش شامل دو عمليات ساده باشد و سپس جايگزين‌كردن اين عمليات با يك ترتيب مشخص در لايه‌هاي نورون‌هاي عصبي. لايه A بايد ورودي‌هاي اصلي از عصب نوري چشم را فيلتر كند؛ لايه B نيز نتايجي را كه از سلول‌ها در لايه A جمعآوري شده با هم تركيب مي‌كند؛ لايه C ورودي‌ها از لايه B را فيلتر مي‌كند. لايه D نيز نتايج لايه C را به هم متصل مي‌كند و به همين ترتيب كار ادامه پيدا مي‌كند.

در اثر افزايش سيگنال‌ها در لايه‌هاي گفته شده، خروجي‌هاي پردازه‌هايي كه به صورت موازي پردازش شده‌اند، به آرامي به هم متصل و موجوديت‌ها با هم ادغام مي‌شوند و نويزها (پارازيت‌ها) از ميان مي‌روند. Serre و Poggio از اين روش لايه‌بندي استفاده كردند تا مدل پيشنهادي خود را قادر به پردازش موازي كنند.

روش ديگري كه آن‌ها براي پياده‌سازي آن از زيست‌شناسي استفاده كردند، افزايش تعداد اتصالاتي بود كه به واحدهاي سوييچينگ اصلي آن‌ها وصل مي‌شد. واحدهاي سوييچينگ در كامپيوترهاي رايج امروزي داراي اتصالات بسيار كم، (در حدود سه اتصال)، هستند؛ ولي تعداد نورون‌هاي عصبي كه به مثابه واحدهاي سوييچينگ مغز هستند، به هزاران و گاه حتي ده‌ها هزار عدد مي‌رسد. Serre و Poggio در مدل خود از سوييچ‌هاي منطقي با تعداد معقول استفاده كردند. همچنين گاه از حدس‌ها و آموخته‌هايي مبتني بر تجربيات خود از ساختار نورون‌ها استفاده كردند كه البته هنوز از ديد علمي قابل توضيح نيست.

Serre و Poggie براي تست تئوري خود، به توسعه يك برنامه كامپيوتري ويژه شناسايي بي‌درنگ پرداختند كه مي‌توانست تصاوير ديجيتال را تحليل كند. وقتي فايل‌هاي تصوير ديجيتال به برنامه داده مي‌شود، برنامه اطلاعات آن را به لايه‌هاي چندگانه فيلتركننده (كه در بالا به آن‌ها اشاره شد) و سلول‌هاي متصل كننده مي‌رساند تا با اين‌كار، برنامه خودش را براي شناسايي و دسته بندي تصاويرآموزش دهد. Serre مي‌گويد: وي مي افزايد، پژوهش‌هاي گذشته درباره هوش مصنوعي، شناسايي را شتابزده و بدون توجه به اطلاعات كليدي بررسي مي كرد؛ اطلاعاتي كه مي‌توانست در همان زمان آن‌ها را به نتيجه برساند.

نحوه عملكرد Serre و Poggio موفقيت بزرگي محسوب مي‌شد. از نقطه نظر عصب‌شناسي، برخي از حدس‌ها و گمانه‌زني‌هاي آن‌ها موجب پيش‌بيني برخي از حقايق مهم مانند مشاهده سلول‌ها (موسوم به سلول‌هاي OR)شد كه قوي‌ترين يا پايدارترين سيگنال‌ها را از ميان گروهي از ورودي‌ها برمي‌دارند و آن را به فيبرهاي خروجيشان كپي مي‌كنند. (سه نورون عصبي A ،B و C كه همگي به نورون X از نوع نرون‌هاي OR سيگنال مي‌فرستند را تصور كنيد. اگر هر كدام از اين سيگنال‌ها به ترتيب درسطوح 1، 2 و 3 ارسال شوند، نورون X از ورود سيگنال‌هاي A و Bجلوگيري مي‌كند و سيگنالC را در خروجي خود كپي مي‌كند. اگر ترتيب سطوح سيگنال‌ها 3، 2 و 1 بود، سيگنال Aدر خروجي X كپي مي‌شد و از ورود سيگنال‌هاي B و C جلوگيري مي‌شد.)

اين نتايج به دست آمده تنها از ديد دانش هوش‌مصنوعي جالب به نظر مي‌رسند. وقتي نرم‌افزار شناسايي بي‌درنگSerre و Poggio تست وجود يا عدم وجود يك جانور را از افراد مورد آزمايش مي گرفت، عملكرد كامپيوتر به خوبي عملكرد انسان بود؛ و بهتر از عملكرد بهترين برنامه‌هاي بينايي ماشين موجود!

(اين نرم افزار در هشتاد و دو درصد مواقع به پاسخ درست مي‌رسيد. جالب آن‌كه، ميزان موفقيت براي انسان‌ها، هشتاددرصد بود.) اين تقريباً نخستين بار بود كه يك برنامه پردازش تصوير عمومي به خوبي انسان عمل مي كرد.
نتايج اميدبخشِ به دست آمده Poggio و Serre را بر آن داشته است به چيزي فراتر از شناسايي بي‌درنگ فكر كنند. Poggio اظهار اميدواري مي‌كند كه اين مدل بتواند به همين خوبي در بررسي حس شنوايي نيز مورد استفاده قرار بگيرد. Serre در انجام چنين ريسكي از اين هم پيشتر مي‌رود و مي‌گويد: شناسايي عمومي اشيا، اساس شناسايي بر اساس حواس است. شايد به همين خاطر است كه وقتي مي‌خواهيم نشان دهيم كه چيزي را فهميده‌ايم يا متوجه شده‌ايم، مي‌گوييم (1)

هر چند توسعه تئوري آن‌ها به حيطه‌هاي جديد، نيازمند پيشرفت‌هاي بيشتري است، مدل پيشنهادي Sierre وPoggio گسترش خود به هر دو دانش هوش مصنوعي و عصب‌شناسي را در دانشگاه ام‌آي‌تي آغاز كرده است. Stan Bileschi دانشجوي سال آخر مهندسي برق، اخيراً در پايان‌نامه دكتراي خود به معرفي مدلي موسوم به تشخيص صحنه (scene recognition) پرداخته است كه اساس قضاوت‌هاي سطح بالاي انسان محسوب مي‌شود. اين مدل شامل شناسايي اشياي مجزا از هم، مانند گاو، نرده‌هاي طويل كنار مزرعه و هر آنچه كه در آنجا قرار دارد مي شود. Bileschi بر اين باور است كه تحليل يك صحنه برتر از عملكرد بسياري از برنامه‌هاي پردازش تصوير ماشيني (مانند پاييدن يك شيء) است.

Poggio مي‌گويد تشخيص بي‌درنگ مبنا و اساس شناسايي‌هاي تصوير است، ولي همهِ چيزي نيست كه ما نيازمند آنيم. سطوح متفاوتي از شناسايي وجود دارد كه تشخيص بي‌درنگ يكي از ساده‌ترين انواع آن است. بسته به وضعيت موجود، يك شيء مي‌تواند به عنوان يك اسباب بازي، يك عروسك، بازتابي از فرهنگ آمريكايي، يك شخصيت يا هر چيز ديگري معرفي شود. (اگر قصد خريد يك عروسك را داشته باشيد، عروسك پشت ويترين براي ما، يك عروسك يا اسباب بازي است، ولي اگر آن عروسك در يك نمايشگاه تجارت و صادرات عرضه شود، به عنوان يك محصول تجاري و صادراتي معرفي مي‌شود. يعني وضعيتي كه در آن قرار داريم، تعريف ما از اشيا را تحت تأثير قرار مي‌دهد.)

به طرز مشابهي در مسائل شطرنج، تشخيص حركت درست ممكن است بسته به آرايش مهره‌ها، به چند ثانيه، دقيقه يا ساعت زمان نياز داشته باشد. مي‌توان گفت هر چه مشكلات بغرنج تر مي‌شوند، مرتفع كردن آن‌ها به كاركردهاي مغزي پيشرفته‌تري نياز پيدا مي‌كند كه نياز به زمان بيشتري خواهد داشت.

يك مدل شناسايي يا تشخيص بي‌درنگ شايد بتواند مسائل بصري‌اي را كه مانع پيش روي توسعه و بهبود ساخت و پايداري روبات‌ها است حل كند. همچنين توسعه اين مدل مي‌تواند كاربردهاي واقعاً ارزشمند ديگري نيز داشته باشد. مانند افزودن قابليت تشخيص پيچيدگي‌ها ودلايل آن‌ها در تصويري از يك چشم‌انداز يا منظره. روشن است كه اين نوع از شناسايي بسيار سطح بالا محسوب مي شود.

گام بعدي، ساخت مدل‌هاي تشخيص‌دهنده‌اي است كه منابع هر چه بيشتري را به سيستم خود مي‌افزايند و بر همين اساس نياز به زمان بيشتري براي پردازش دارند. Serre مي‌گويد:

  امتیاز: 0.00