زبان و خط فارسي در اينترنت :
حجم اطلاعات به زبان فارسي در روي اينترنت در اشكال مختلف آن به سرعت رشد كرده است. در حال حاضر توسعه وبلاگهاي فارسي و سايتهاي علمي و تبليغاتي و دانشگاهي به زبان فارسي باعث شده است كه جايگاه زبان فارسي تا حد زبان اول ارتباطات اينترنتي نزد ايرانيان و فارسيزبانان در سراسر جهان ارتقا يابد. شايد بتوان گفت كه اولين مرجع وبلاگنويسي فارسي با انتشار راهنماي ساخت وبلاگ فارسي آغازشده است. بدون شك دومين موج نيز با شروع به كار سايت پرشين بلاگ كه امكان راهاندازي وبلاگ براي كاربران فارسي زبان را با سهولت بيشتري فراهم ميكند آغاز شده است. اما پيامد قابل توجه ديگري كه رشد وبلاگنويسي در ايران داشته است پيدايش سايتهاي اينترنتي فارسي زباني است كه صاحبان وبلاگها ايجاد كردهاند و اين خود موج جديدي از گسترش كاربرد اينترنت در جامعه ايران به حساب ميآيد. اكنون روي آوردن برخي از روزنامهنگاران ، پژوهشگران، دانشجويان و .... به وب فارسي و استفاده از منابع خبري و علمي و .... آن موجب تقويت نقش رسانهاي وب فارسي شده است.
پديده ديگري كه باعث گسترش زبان و خط فارسي در اينترنت شده است ايجاد كتابخانههاي ديجيتالي فارسي در شبكه جهاني است، با اين كه از شكلگيري كتابخانههاي فارسي در شبكه جهاني مدت زيادي نميگذرد با اين حال به سرعت در حال رشد و گسترش است. شماري از اين كتابخانهها در پايگاههاي اينترنتي شكل گرفتهاند و بسياري وبلاگهايي هستند كه براي اين كار راهاندازي شدهاند. از ويژگيهاي اين كتابخانهها اين است كه هيچ يك جنبه تجاري ندارند و نيز به جز عده معدودي اكثر كتابخانهها كوشيدهاند جانب بيطرفي را رعايت كرده و از اعمال سليقه شخصي پرهيز كنند. آنچه در بسياري از كتابخانههاي مجازي فارسي در دسترس است تنها شامل كتاب نيست بلكه نوشتههايي اعم از داستان ، مقاله، تك نگاشت و .... نيز در ميان مجموعهها ديده ميشود. هم چنين است آثاري كه احتمالاً هيچ گاه چاپ كاغذي ندارند و البته وجود كتابهايي كه مدتهاست ناياباند و مجال انتشار دوباره نيافتهاند و يا آثاري كه امروز به دلايلي بازچاپ آنها مقدور نيست از جاذبههاي كتابخانههاي مجازياند. در اينجا شماري از اين كتابخانهها ذكر ميشوند: پايگاه اينترنتي كتابهاي رايگان فارسي، پايگاه اينترنتي باني تك، كتابخانه مجازي داستانهاي فارسي، آواي آزاد، پايگاه اينترنتي خوابگرد، كتابخانه دوات، پايگاه اينترنتي سخن، وبلاگ كتابخانه هرمس، پايگاه اينترنتي گفتمان، پايگاه تاريخ و فرهنگ ايران زمين،پايگاه مركز جهاني اطلاعرساني آل البيت، كتابخانه پايگاه اينترنتي حوزه، پايگاه اينترنتي امام علي علیهالسلام، پايگاه اينترنتي كتابخانه ديجيتال و .... كه لازم به ذكر است غلبه با كتابهاي دو حوزه ادبيات و دين است.16c045055bf7c8b3e180d3b946320aa8 كاربران به دلايل مختلفي از قبيل` دسترسي آسان و ارزان به حجم عظيم اطلاعات ، عدم نياز اطلاعات يافته شده از اينترنت به تايپ مجدد ، دسترسي سريع و اطلاعات جديد، صرفهجويي در وقت و مهمترين دليل، عدم تسلط اكثر كاربران به زبان انگليسي `كه زبان غالب بر اينترنت است` به دنبال اطلاعات فارسي از اينترنت هستند. گسترش زبان و انبوهي از نوشتارها ايجاب ميكند كه خط ضابطه داشته باشد و از سوي ديگر پيشرفت فنآوري و پيدايش اينترنت خواستار ضابطه و قانونمندي است. اطلاعرساني كه جنبه بينالملي پيدا كرده است بدون دستورِ خطي سامان يافته و نظاممند ميسر نيست و دستكم دشواريها ميآفريند. در حال حاضر وبلاگهاي فارسي مقام دوم يا سوم را در جهان دارا ميباشد. به نظر دكتر آشوري“ اگر زبان فارسي به همين صورت بيدقت در اينترنت به كار رود در سطح زباني براي تفنن باقي خواهد ماند و كمتر حرفي جدي به اين زبان زده خواهد شد. آينده زبان فارسي در اينترنت بستگي به اين دارد كه نويسندگان فارسي تا چه حد كار خود را جدي بگيرند و اين زبان را بازسازي كنند كه از لحاظ قدرت بيان و دقت مفاهيم و استواري ساختار دستوري به زبان انگليسي نزديك شود“.3fce87e695b778928e7b6a61824b91dd616a70b933e0d14fb40868c6f4b75a نبود استاندارد ثابت رسم الخط فارسي موجب اين شده است كه به تعداد صفحات وب فارسي سبك و سياق نگارش به كار رفته باشد لكن ميتوان چنين ارزيابي نمود كه اكثر وبهاي فارسي در برخي خصوصيات مشترك ميباشند از جمله اين كه نگارش برخي از آنها زبان غير رسمي و محاورهاي ميباشد و به خصوص در متون علمي اغلب واژههاي بيگانه به دفعات استفاده ميشود. رسمالخط مورد استفاده نيز متفاوت و سليقهاي است و برخي از آنها غلطهاي تايپي و نگارشي فراواني دارند و اين خصوصيات، اغلب به جهت محدوديتهاي محيط الكترونيكي و عدم تطابق رسم الخط فارسي با آن ميباشد كه نمايهسازي و سپس جستجو به اين زبان را با دشواريهايي رو به رو ميسازد.
با توجه به اين نكته كه اطلاعات ارزشمند فراواني در اينترنت وجود دارد و اينترنت با شتابي فراوان به يك منبع اطلاعاتي ممتاز تبديل شده است. موتورهاي جستجو به عنوان يكي از اساسيترين دروازههاي ورود به منابع اينترنتي داراي ضعفهايي هستند. كه ميتوان به اين موارد اشاره كرد:
- در يك مجموعه از يافتههاي بازيابي شده مدخلهاي تكراري فراواني ملاحظه ميشود.
- نتايج غير قابل پيشبيني هستند.
- نتايج چه بسا گمراه كننده باشند: ممكن است جستجويي در يك موتور كاوش نتيجهاي نداشته، ولي در موتور ديگر داراي يافتههاي فراوان باشد.
- موتورهاي كاوش محتويات پايگاههاي اطلاعاتي خودشان را نشان نميدهند و از معيارهايي كه براي گنجاندن يك مدرك در فايلهايشان دارند حتي شرحي ارائه نميكنند.
- مهار واژگاني وجود ندارد و قواعد نقطهگذاري و بزرگنويسي نيز استاندارد نيست.
- بدون بررسي عملي هر عنصر، اغلب نميتوان ميزان ربط و رابطهها را تحليل كرد. يعني اطلاعات كافي در مدخل نمايه نيست تا فرد بتواند دست به انتخاب بزند.461afdb1cdaea7fdbaaf5ccebedc3a6372c1b33e163e2bbcf5489b7005de1f - عدم توان موتورهاي جستجو در تمايز ميان مداركي كه توسط فرد الف نوشته شده و مداركي كه در باره فرد الف نوشته شده است.
- منابع قابل توجهي در شبكه وب وجود دارند كه توسط موتورهاي جستجو نمايه نميشوند. به اين بخش از وب اصطلاحاً وب نامرئي ميگويند. `وب نامرئي بخش بزرگي از وب است كه موتورهاي جستجو آنها را نمايه نميكنند يا نميتوانند نمايه كنند و عبارتند از: سايتهاي داراي رمز عبور، فايلهاي پي. دي. اف از متون آرشيو شده، ابزارهاي تعاملي نظير ماشين حسابها و برخي از واژهنامهها و همچنين بعضي از پايگاههاي اطلاعاتي، منابع محافظت شده از طريق اسم كاربر و گذرواژه، منابع و صفحات وب بدون پيوند و صفحات افزون بر حداكثر تعداد صفحات قابل مرور`aea7fdbaaf5ccebedc3a6372c1b33e16.
جستجوي اطلاعات در اينترنت به دو روش ميتواند صورت گيرد يكي استفاده از جملات زبان محاورهاي است و ديگري بكارگيري كلمات كليدي. در روش استفاده از جملات زبان محاورهاي كه اغلب به كاربران تازهكار پيشنهاد ميگردد، مورد سوال خود را در قالب يك جمله سوالي مطرح ميسازند. يكي از عيبهاي بزرگ اين روش تعداد نتايج جستجوي زيادي است كه بازگردانده ميشود. به همين دليل اين روش توسط كاربران حرفهاي و حتي توسط همه، كمتر استفاده ميشود. اما چنانچه از اين روش استفاده بشود بايستي سعي در انتخاب بهترين نوع جمله بشود و توصيه ميشود در انتخاب يك يك كلمات لحظهاي درنگ نموده و با ظرافت خاصي جمله نهايي را مطرح نمود.
يكي از كاراترين و مقتدرترين روشهاي جستجوي اطلاعات در دنياي وب استفاده از واژههايي است كه اصطلاحاً كلمات كليدي ناميده ميشوند. اغلب كاربران حرفهاي و جستجوگران ورزيده دنياي اينترنت ميتوانند با طرح بهترين كلمات كليدي و بكار بستن قوانين تركيب آنها با هم براي نيازهاي اطلاعاتي خود پاسخي در خور بيابند. در اين روش توصيههاي زير براي انتخاب كلمات كليدي و نيزجستجوي دقيق و مفيد پيشنهاد ميشود:
1- حتيالمقدور سعي شود كلمات كليدي از ميان اصطلاحات منحصر به فرد و اسامي خاص انتخاب بشود.
2- حتيالمقدور از آوردن كلمات عمومي كه عناوين بسياري را در زير مجموعه خود شامل ميشوند جداً خودداري كنيد.
3 – هميشه اسم شخص يا نام شي يا هر چيز ديگري را كه مد نظر داريد بطور كامل وارد كنيد.
4 – دقت كنيد كه اگر موتور جستجو ميان حروف بزرگ و كوچك تفاوتي ميگذارد، اين مسئله را در طرح كلمات كليدي خود مد نظر داشته باشيد.
5 – در نظر داشته باشيد اگر نتيجه جستجو صفر بود به احتمال زياد ميتواند از يك اشتباه تايپي باشد.
6 – اگر املاي صحيح و كامل كلمهاي را نميدانيد از كاركتر جانشين كه اغلب * و يا ؟ است استفاده كنيد.
7 – اگر يك كلمه كليدي را براي طرح دقيق و تمام و كمال يك مورد جستجو كفايت نميكند از تكنيكهاي جستجوي عبارتي، استفاده از اپراتورهاي جبر بولين (AND, OR, NOT) استفاده كنيد. جستجوي عبارتي يكي از مهمترين و قدرتمندترين امكانات جستجو در اغلب موتورهاي جستجو ميباشد و ميتوان يك عبارت يا جمله مشخص را به همان ترتيبي كه كلمات وارد شدهاند مورد جستجو قرار داد. براي اين روش جستجو عبارت مورد نظر را داخل گيومه`` بگذاريد
8 - استفاده از عملگر AND : and به مفهوم `و` براي محدود كردن دامنه جستجو از طريق تركيب كليدواژههاي مختلف به كار ميرود و براي تركيب كليدهاي جستجو زمانيكه براي شما مهم است كه دو يا چند كلمه كليدي حتماً وجود داشته باشد و علامت آن در پايگاههاي مختلف به صورت استفاده از عبارت and ،استفاده از + ، انتخاب عبارت all the word از منو، انتخاب عبارت match on all words (and) بوسيله كليك كردن بر روي دكمههاي راديويي ميباشد.
9 – استفاده از عملگر OR: اپراتور OR به مفهوم `يا` و برخلاف عملگر AND باعث گسترش دامنه جستجو و بازيابي اطلاعات بيشتر شده براي تركيب كليدواژههاي جستجو زماني كه انتظار داريد تنها يك، دو يا چند كلمه كليدي حضور داشته باشند و علامت آن استفاده از عبارت or، نحوه اجراي ساده و معمولي آن، انتخاب عبارت any of the words از منو، انتخاب عبارت match on any words (or) با كليك بر روي دكمه هاي راديويي ميباشد. يكي از كاربردهاي مهم اين عملگر پوشش مفاهيم يا اصطلاحات مترادف، مرتبط، يا با املاهاي متفاوت ميباشد.
16c045055bf7c8b3e180d3b946320aa8 – استفاده از عملگر NOT : اپراتور Not به مفهوم `نه` و يا به جز كه در اين صورت تمامي جوابهاي بازگشتي كه حاوي عبارت يا كلمه كليدي هستند حذف خواهند گرديد و براي اجراي آن تنها كافيست كه not را قبل از عبارت يا كلمه كليدي مورد نظرتان با يك فاصله بياوريد.
3fce87e695b778928e7b6a61824b91dd616a70b933e0d14fb40868c6f4b75a – استفاده از كوتاهسازي 14كليد واژهها: اين تكنيك به ما امكان ميدهد كه با وارد كردن بخشي از يك كليدواژه بتوانيم مشتقات مختلف آن را نيز در فرآيند جستجو بازيابي كنيم. اكثر موتورهاي جستجو اين تكنيك را با استفاده از علامت ستاره (*) ارائه ميدهند. يكي از مشكلات استفاده از اين تكنيك اين است كه باعث بازيابي اطلاعات غيرمرتبط و ناخواسته زيادي ميشود.
461afdb1cdaea7fdbaaf5ccebedc3a6372c1b33e163e2bbcf5489b7005de1f – استفاده از عملگر نزديكيابي15: در بسياري از موارد استفاده از عملگر and باعث بازيابي اطلاعاتي شود كه براي ما مفيد نميباشد، به اين دليل كه اين عملگر كليدواژهها را در هر كجاي متن كه باشند بازيابي ميكند. در اين موارد استفاده از تكنيك نزديكيابي ميتواند از ريزش كاذب اطلاعات و يا بازيابي اطلاعات غير مرتبط جلوگيري نمايد. همه موتورهاي جستجو قابليت استفاده از اين تكنيك را ندارند ولي به عنوان مثال در موتور جستجوي آلتاويستا ميتوان با استفاده از عملگر NEAR از اين تكنيك استفاده نمود.
aea7fdbaaf5ccebedc3a6372c1b33e16 – جستجوي تركيبي با استفاده از پرانتز: اين تكنيك يكي از مهمترين تكنيكهاي جستجو ميباشد كه به وسيله آن ميتوان تا حدود زيادي از بازيابي موارد غير مرتبط در محيط وب جلوگيري كرد. در اين روش ميتوان از همه عملگرهاي جستجو كه در بالا گفته شده يكجا استفاده كرد و آنها را با همديگر تركيب نمود.
14 – جستجوي كليدواژه در عنوان صفحات وب: اين تكنيك با اين پيش فرض كه عنوان يك صفحه وب تا حدود زيادي نمايانگر محتواي اطلاعات موجود در آن است به جستجوي واژههاي كليدي در عنوان سايتها ميپردازد. علامت آن در موتورهاي جستجو متفاوت است ولي اغلب موتورهاي جستجو از طريق فهرست انتخابي و يا گزينههاي ديگر اين امكان را فراهم ميآورند.
15 – جستجوي حوزه سايتها: با توجه به اين كه به صورت قراردادي هر كشوري حوزه خاصي در محيط وب دارد، قابليت جستجوي حوزه سايتها به ما اين امكان را ميدهد كه فرايند جستجو را به حوزه خاصي نظير سايتهاي وب ايران (ir) و يا سايتهاي وب سازمانهاي غير انتفاعي (org) محدود كنيم. دستورات استفاده از اين تكنيك در موتورهاي جستجو مختلف ميباشد.
16 – محدود كردن جستجو به زبانهاي مختلف؛ باعث ميشود نتايج جستجو به زبانهاي ديگر آورده نشود و انتخاب مطلب مورد نظر آسانتر است.
17 – محدود كردن جستجو به تاريخ انتشار منابع در وب: تاريخ انتشار يا به اصطلاح روزآمدي مطلب به خصوص در منابع علمي اصل مهمي است و اينگونه محدوديت باعث ميشود بنا به نياز كاربر جديدترين و يا قديميترين منبع بازيابي بشود.
18 – جستجوي رسانههاي مختلف: موسيقي، عكس، ويدئو : زماني كه فقط نوع خاصي از رسانه مورد نياز است به عنوان مثال زماني كه به عكس يك شخصيت نياز داريم، جستجو در ميان عكسها باعث ميشود نتيجه جستجو شامل اطلاعات ديگري در مورد آن شخصيت نباشد.
19 – جستجوي صفحات با فرمتهاي مختلف: PDF, Word, MP3, MPEG, ….: زماني كه فرمت خاصي مورد نظر است ميتوان از اين تكنيك استفاده كرد . به عنوان مثال اگر مايل باشيم منبع بازيابي شده در فرمت PDF باشد، اين تكنيك ميتواند مفيد باشد.
20 – آگاهي از پيشفرضهاي جستجو در موتور جستجو: با توجه به اين كه هر موتور جستجو براي تركيب واژهها يك پيشفرض دارد و اگر از هيچ گونه عملگري استفاده نشود، كليدواژهها را به صورت پيشفرض با يكي از عملگرهاي جبر بولي تركيب ميكند؛ آگاهي از اين پيشفرض موتورهاي جستجوي مختلف مهارت ما را در جستجو بالا ميبرد.
21 – وب نامرئي: وب نامرئي به دو دليل كمّي و كيفي اهميت دارد كمّي از اين نظر كه موتورهاي جستجو فقط قادر هستند حدود 16 درصد از اطلاعات موجود دراينترنت را بازيابي كنند و اندازه وب نامرئي تقريبا 500 برابر وب مرئي است و كيفي از اين نظر كه منابع اطلاعاتي موجود در وب عميق معمولا ارزشمند و مفيد هستند و در بسياري از موارد پاسخگوي نياز كاربران ميباشند. آشنايي با ابزارهايي كه براي شناسايي منابع وب نامرئي به وجود آمدهاند و كاربران را به سايتهاي مناسب راهنمايي ميكنند، باعث دسترسي به اين بخش عظيم از اطلاعات مفيد و ارزشمند ميشود. مثل سايت Invisibleweb كه فهرستي از منابع نامرئي را و سايت Completeplaset كه فهرستي از تقريبا 40000 پايگاه اطلاعاتي وب نامرئي را ارائه ميدهد.16
امتیاز: 0.00
وزارت آموزش و پرورش > سازمان پژوهش و برنامهريزی آموزشی
شبکه ملی مدارس ایران رشد
شما باید یک عنوان و متن وارد کنید!