منو
 کاربر Online
676 کاربر online
 : کامپیوتر
برای پاسخ دادن به این ارسال باید از صفحه قبلی اقدام کنید.   کاربر offline دبیر گروه کامپیوتر 3 ستاره ها ارسال ها: 1679   در :  چهارشنبه 31 اردیبهشت 1393 [17:11 ]
  خط فارسی و مشکلات جستجو در اینترنت
 

خط فارسی دارای مشکلات مختلفی است که در جستجو و بازیابی اطلاعات، مسائل و مشکلات فراوانی را فراروی کابران اینترنت قرار می دهد. به خصوص با رشد سریع انتشارات الکترونیکی بر روی وب در شکل های مختلف پایگاه های اطلاعاتی، وبلاگ و… هیچ قاعده مشخص و ثابتی برای رسم الخط فارسی وجود ندارد و این مسأله باعث شده تا جستجوگران مطالب فارسی با مشکلات فراوانی روبرو شوند.
اینترنت به عنوان یک محمل اطلاعاتی عظیم، منابع اطلاعاتی را در مقیاسی وسیع در دسترس مخاطبان بالقوه قرار داده است. سهولت دسترسی به منابع اطلاعاتی اعم از متن و سایر رسانه ها عمده ترین مزیت اینترنت محسوب می شود. این توانایی که هر کس ناشر آثار خود باشد عواقب ناخواسته ای را نیز در پی خواهد داشت و آشکارترین معضل، آن است که انبوهی از منابع بسیار متنوع و غیرقابل مدیریت را فراهم می آورد.
افزایش سریع منابع اینترنتی نیازمند یک سازمان دهی مفید و مؤثر است. هرچند در حال حاضر راهنمای هایی برای منابع اینترنتی تهیه شده است که براساس فایل های مقلوب ساخته شده توسط موتورهای جستجو و با استفاده از قابلیت های مختلف این موتورها از جمله؛ استفاده از عملگرهای بولی، جستجوی دقیق عبارت، محدود کردن یک جستجو به بخش خاصی از رکورد (مانند عنوان، آدرس) کوتاه سازی کلمات، جستجوی نزدیک یابی واژه ها، ایجاد محدودیت زمانی و منطقه ای و زبانی و …. به جستجوی اطلاعات کمک می کند که می توانید این موارد را در بخش تالار مهندسی اینترنت سایت میکرورایانه مطالعه کنید. اما باید تأکید کرد که در امر بازیابی اطلاعات از اینترنت بدون نمایه سازی نظام یافته نمی توان انتظار بازیابی مفید و مؤثر را داشت.
هرچند بیشترین اطلاعات موجود بر روی اینترنت به زبان انگلیسی است، ولی حجم اطلاعات به زبان فارسی نیز با سرعت در حال افزایش است و کاربران به دلایل مختلفی علاقه زیادی به اطلاعات فارسی نشان می دهند و از آن جایی که زبان غالب در اینترنت انگلیسی است، جستجو به زبان های غیرانگلیسی از جمله فارسی، مسایل و مشکلات مختلفی را جدای از مشکلات عمومی اینترنت دارد.
حجم اطلاعات به زبان فارسی در روی اینترنت در اشکال مختلف آن به سرعت رشد کرده است. در حال حاضر توسعه وبلاگ های فارسی، سایت های علمی، تبلیغاتی و دانشگاهی به زبان فارسی باعث شده است که جایگاه زبان فارسی تا حد زبان اول ارتباطات اینترنتی نزد ایرانیان و فارسی زبانان در سراسر جهان ارتقاء یابد. شاید بتوان گفت که اولین مرجع وبلاگ نویسی فارسی با انتشار راهنمای ساخت وبلاگ فارسی آغاز شده است. بدون شک دومین موج نیز با شروع به کار سایت پرشین بلاگ که امکان راه اندازی وبلاگ برای کاربران فارسی زبان را با سهولت بیش تری فراهم می کند آغاز شده است که در تاپیکهای دیگر سایت میکرورایانه می توانید در مورد آنها را مطالعه کنید. اما پیامد قابل توجه دیگری که رشد وبلاگ نویسی در ایران داشته است پیدایش سایت های اینترنتی فارسی زبانی است که صاحبان وبلاگ ها ایجاد کرده اند و این خود موج جدیدی از گسترش کاربرد اینترنت در جامعه ایران به حساب می آید.
اکنون روی آوردن برخی از روزنامه نگاران، پژوهش گران، دانشجویان به وب فارسی و استفاده از منابع خبری، علمی و …. موجب تقویت نقش رسانه ای وب فارسی شده است.
پدیده دیگری که باعث گسترش زبان و خط فارسی در اینترنت شده است، ایجاد کتابخانه های دیجیتالی فارسی در شبکه جهانی است. با این که از شکل گیری کتابخانه های فارسی در شبکه جهانی مدت زیادی نمی گذرد، اما با این حال به سرعت در حال رشد و گسترش است. شماری از این کتابخانه ها در پایگاه های اینترنتی شکل گرفته اند و بسیاری وبلاگ هایی هستند که برای این کار راه اندازی شده اند. از ویژگی های این کتابخانه ها این است که هیچ یک جنبه تجاری ندارند. آنچه در بسیاری از کتابخانه های مجازی فارسی در دسترس است فقط شامل کتاب نیست، بلکه نوشته هایی اعم از داستان، مقاله، تک نگاشت و …. نیز در میان مجموعه ها دیده می شود. هم چنین آثاری که احتمالاً هیچ گاه چاپ کاغذی ندارند و البته وجود کتاب هایی که مدت هاست نایاب هستند و مجال انتشار دوباره نیافته اند و یا آثاری که امروز به دلایلی بازچاپ آن ها مقدور نیست، از جاذبه های کتابخانه های مجازی اند.
پایگاه اینترنتی کتاب های رایگان فارسی، پایگاه اینترنتی بانی تک، کتابخانه مجازی داستان های فارسی، آوای آزاد، پایگاه اینترنتی خوابگرد، کتابخانه دوات، پایگاه اینترنتی سخن، وبلاگ کتابخانه هرمس، پایگاه اینترنتی گفتمان، پایگاه تاریخ و فرهنگ ایران زمین، پایگاه مرکز جهانی اطلاع رسانی آل البیت، کتابخانه پایگاه اینترنتی حوزه، پایگاه اینترنتی امام علی علیه‌السلام، پایگاه اینترنتی کتابخانه دیجیتال و …. شماری از این کتابخانه ها هستند. کاربران به دلایل مختلفی از قبیل دسترسی آسان و ارزان به حجم عظیم اطلاعات، عدم نیاز اطلاعات یافته شده از اینترنت به تایپ مجدد، دسترسی سریع و اطلاعات جدید، صرفه جویی در وقت و عدم تسلط اکثر کاربران به زبان انگلیسی که زبان غالب بر اینترنت است به دنبال اطلاعات فارسی از اینترنت هستند.
گسترش زبان و انبوهی از نوشتارها ایجاب می کند که خط ضابطه داشته باشد و از سوی دیگر پیشرفت فناوری و پیدایش اینترنت خواستار ضابطه و قانونمندی است. اطلاع رسانی که جنبه بین الملی پیدا کرده است بدون دستور خطی سامان یافته و نظام مند میسر نیست و دست کم بر دشواری ها می آفریند.
در حال حاضر وبلاگ های فارسی مقام دوم یا سوم را در جهان دارا می باشد. به نظر دکتر آشوری، اگر زبان فارسی به همین صورت بی دقت در اینترنت به کار رود در سطح زبانی برای تفنن باقی خواهد ماند و کم تر حرفی جدی به این زبان زده خواهد شد. آینده زبان فارسی در اینترنت بستگی به این دارد که نویسندگان فارسی تا چه حد کار خود را جدی بگیرند و این زبان را بازسازی کنند که از لحاظ قدرت بیان و دقت مفاهیم و استواری ساختار دستوری به زبان انگلیسی نزدیک شود.
نبود استاندارد ثابت رسم الخط فارسی موجب این شده است که به تعداد صفحات وب فارسی سبک و سیاق نگارش به کار رفته باشد،بنابراین می توان چنین ارزیابی کرد که اکثر وب های فارسی در برخی خصوصیات مشترک می باشند از جمله این که نگارش برخی از آن ها زبان غیررسمی و محاوره ای است و به خصوص در متون علمی اغلب واژه های بیگانه به دفعات استفاده می شود. رسم الخط مورد استفاده نیز متفاوت و سلیقه ای است و برخی از آن ها غلط های تایپی و نگارشی فراوانی دارند و این خصوصیات، اغلب به جهت محدودیت های محیط الکترونیکی و عدم تطابق رسم الخط فارسی با آن می باشد که نمایه سازی و سپس جستجو به این زبان را با دشواری هایی رو به رو می سازد.
با توجه به این نکته که اطلاعات ارزشمند فراوانی در اینترنت وجود دارد و اینترنت با شتابی فراوان به یک منبع اطلاعاتی ممتاز تبدیل شده است. موتورهای جستجو به عنوان یکی از اساسی ترین دروازه های ورود به منابع اینترنتی دارای ضعف هایی هستند که می توان به این موارد اشاره کرد:
▪ در یک مجموعه از یافته های بازیابی شده مدخل های تکراری فراوانی ملاحظه می شود. ▪ نتایج غیر قابل پیش بینی هستند. ▪ نتایج چه بسا گمراه کننده باشند؛ ممکن است جستجویی در یک موتور کاوش نتیجه ای نداشته، ولی در موتور دیگر دارای یافته های فراوان باشد.
▪ موتورهای کاوش محتویات پایگاه های اطلاعاتی خودشان را نشان نمی دهند و از معیارهایی که برای گنجاندن یک مدرک در فایل هایشان دارند حتی شرحی ارائه نمی کنند.
▪ مهار واژگانی وجود ندارد و قواعد نقطه گذاری و بزرگ نویسی نیز استاندارد نیست.
▪ بدون بررسی عملی هر عنصر، اغلب نمی توان میزان ربط و رابطه ها را تحلیل کرد. یعنی اطلاعات کافی در مدخل نمایه نیست تا فرد بتواند دست به انتخاب بزند.
▪ عدم توان موتورهای جستجو در تمایز میان مدارکی که توسط فرد الف نوشته شده و مدارکی که درباره فرد الف نوشته شده است.
▪ منابع قابل توجهی در شبکه وب وجود دارند که توسط موتورهای جستجو نمایه نمی شوند. به این بخش از وب اصطلاحاً وب نامریی می گویند.
وب نامریی بخش بزرگی از وب است که موتورهای جستجو آن ها را نمی توانند نمایه کنند و عبارتند از: سایت های دارای رمز عبور، فایل های پی.دی.اف از متون آرشیو شده، ابزارهای تعاملی نظیر ماشین حساب ها و برخی از واژه نامه ها و هم چنین بعضی از پایگاه های اطلاعاتی، منابع محافظت شده از طریق اسم کاربر و گذر واژه، منابع و صفحات وب بدون پیوند و صفحات افزون بر حداکثر تعداد صفحات قابل مرور.

جستجوی اطلاعات در اینترنت به دو روش می تواند صورت گیرد یکی استفاده از جملات زبان محاوره ای است و دیگری بکارگیری کلمات کلیدی. در روش استفاده از جملات زبان محاوره ای که اغلب به کاربران تازه کار پیشنهاد می شود. یکی از عیب های بزرگ این روش تعداد نتایج جستجوی زیادی است که بازگردانده می شود. به همین دلیل این روش توسط کاربران حرفه ای و حتی توسط همه، کم تر استفاده می شود. یکی از کاراترین و مقتدرترین روش های جستجوی اطلاعات در دنیای وب استفاده از واژه هایی است که اصطلاحاً کلمات کلیدی نامیده می شوند. اغلب کاربران حرفه ای و جستجوگران ورزیده دنیای اینترنت می توانند با طرح بهترین کلمات کلیدی و بکار بستن قوانین ترکیب آن ها با هم برای نیازهای اطلاعاتی خود پاسخی در خور بیابند.

  امتیاز: 0.00