بسم الله الرحمن الرحيم
النظم المحسبة للاسترجاع الموضوعي باللغة الطبيعية : دراسة تطبيقية على اللغة العربية
مقدمة
http://www.cybrarians.info/news/n5.htm#intro
أهداف الدراسة
http://www.cybrarians.info/news/n5.htm#aims
مشكلة الدراسة
http://www.cybrarians.info/news/n5.htm#prob
حدود الدراسة
http://www.cybrarians.info/news/n5.htm#bound
فصول الدراسة
http://www.cybrarians.info/news/n5.htm#cont
الافادة من نتائج الدراسة
http://www.cybrarians.info/news/n5.htm#usful
النتائج و التوصيات
http://www.cybrarians.info/news/n5.htm#rsult
مقدمة
يعد "تشجيع التجارب العربية في مجال استخدام اللغة العربية في نظم استرجاع المعلومات، وإجراء الدراسات والبحوث اللازمة لمعالجة المشكلات التي يواجهها العاملون في المكتبات ومراكز المعلومات العربية". من أهم التوصيات التي أوصى بها المؤتمر الثامن للاتحاد العربي للمكتبات والمعلومات. ومن هذا المنطلق تأتي هذه الدراسة ؛ حيث يحتاج موضوع "معالجة الحاسب الآلي للغة العربية" - الذي ينضوي تحت مظلة ما يسمى لغويات الحاسب أو علم اللغة الحاسبي Computational Linguistics - إلى مزيد من الدراسات لاستجلاء مشكلات اللغة العربية من وجهة نظر "علم المعلومات" على وجه العموم ، و "نظم استرجاع المعلومات" على وجه الخصوص.
أهداف الدراسة
1- التعرف على إمكانيات اللغة العربية في نظم استرجاع المعلومات المعتمدة على اللغة العربية.
2- التعرف على المشكلات التي تواجه نظم استرجاع المعلومات المعتمدة على اللغة العربية باعتبارها لغة طبيعية.
3- الوصول إلى حلول مقترحة لتلك المشكلات.
4- محاولة الارتفاع بكفاية الاسترجاع في النظم التي تعتمد على اللغة الطبيعية لغةً للمدخلات والمخرجات.
5- الوصول إلى مجموعة من المعايير والمواصفات التي يجب مراعاتها عند تصميم أو تطوير نظم استرجاع المعلومات العربية في المستقبل.
6- محاولة بناء مرصد بيانات عربي يتأسس على المعايير الدولية ، ويراعي في الوقت ذاته خصائص اللغة العربية ، يكون نموذجًا يحتذى به في المنطقة العربية.
مشكلة الدراسة
تكمن مشكلة الدراسة الرئيسية في محاولة الإجابة عن الأسئلة التالية:
§ ما مدى صلاحية اللغة العربية كلغة لنظام استرجاع معلومات معتمد على اللغة الطبيعية؟
§ هل تختلف اللغة العربية عن غيرها من اللغات في صلاحيتها كلغة لنظام استرجاع المعلومات؟
§ ما المشكلات التي تواجهها اللغة العربية في نظم استرجاع المعلومات؟
§ ما مظاهر الغموض في اللغة العربية باعتبارها لغة طبيعية؟
§ هل للغة العربية خصائص تميزها عن غيرها من اللغات؟ وهل يجب مراعاة هذه الخصائص عند تصميم أو تطوير نظم استرجاع المعلومات في المستقبل؟
حدود الدراسة
تطمح هذه الدراسة إلى محاولة استجلاء مشكلات اللغة العربية من وجهة نظر نظم استرجاع المعلومات ، ويمكن أن نوضح حدود الدراسة ومجالها بشكل أكثر تفصيلا بمحاولة التعرف على ما نقصده بالمصطلحات التالية:
نظم استرجاع المعلومات
يمكن تقسيم تلك النظم إلى:
1- نظم استرجاع الحقائق Fact Retrieval Systems وهى تلك النظم التي يرجع إليها الباحث للحصول على المعلومات بشكل مباشر ، كما في الخدمة المرجعية التي تقدم الإجابة عن الاستفسارات بشكل مباشر ، وتتمثل هذه النظم في مختلف أنواع المراجع: ككتب الحقائق ، والكتب السنوية والإحصائية ، والأدلة ، وكتب التراجم، ومعاجم البلدان، والمعاجم والموسوعات في شكلها المقروء آليا (المحسب) ، التي يمكن أن نطلق عليها ، بنوك المعلومات Data Banks أو مصارف المعلومات.
2- نظم استرجاع الوثائق Document Retrieval Systems ، أو ما يمكن أن نسميه نظم استرجاع الإشارات الببليوجرافية Reference Retrieval Systems ، أو نظم استرجاع بدائل الوثائق، وهى تلك النظم التي يرجع إليها الباحث للحصول على قوائم بالوثائق المتعلقة بموضوع ما ، أو مؤلف ما ، أو فترة زمنية محددة … إلخ ، ويتم الاستعانة هنا بالببليوجرافيات سواء في شكلها التقليدي أم المقروء آليا (أو ما يعرف الآن بمراصد البيانات Data Bases) للإجابة على استفسارات المستفيد.
يركز هذا البحث على النوع الأخير من نظم استرجاع المعلومات ، وهو نظم استرجاع الوثائق.
الاسترجاع الموضوعي
تتم عملية الاسترجاع من خلال مجموعة من نقاط الإتاحة التي يمكن تقسيمها إلى فئتين ؛ الأولى: نقاط الإتاحة المستقاة من البيانات الوصفية ، وهي كافة البيانات الوصفية المتعلقة بالوثيقة ؛ كالعنوان ، والمؤلف ، والناشر ، وتاريخ النشر ، والتبصرات… إلخ. أما الفئة الأخرى من نقاط الإتاحة التي من الممكن أن نطلق عليها (نقاط الإتاحة الموضوعية) ؛ وهي كافة نقاط الإتاحة التي يمكن من خلالها استرجاع الوثائق موضوعيًا ؛ كرقم التصنيف ، ورؤوس الموضوعات ، والواصفات ، والعناوين ، والمستخلصات ، والنصوص الكاملة.
يركز هذا البحث على الفئة الأخيرة فقط من نقاط الإتاحة الموضوعية ، أو الاسترجاع الموضوعي ، وعلى وجه الخصوص الاسترجاع الموضوعي من خلال العناوين.
اللغة الطبيعية
أو اللغة الحرة أو اللغة المطلقة أو غير المقيدة ، هـي أحد نمطين يستخدمان للتعبير عن المحتوى الموضوعي للوثائق ، ويعتمد نمط اللغة الطبيعية على الوثيقة نفسها للتعبير عن نفسها موضوعيا ، دون الاستعانة بأدوات خارجية. أما النمط الآخر من أنماط التعبير عن المحتوى الموضوعي للوثائق ، هو : اللغة المقيدة Controlled Language ، أو المنضبطة ، أو الاصطناعية، أو المحكومة. ويستمد هذا النمط وسائل التعبير الموضوعي عن الوثائق من أدوات معينة ؛ كخطط التصنيف ، وقوائم رؤوس الموضوعات ، والمكانز ، يركز هذا البحث على النمط الأول فقط من أنماط لغات التكشيف، وهو اللغة الطبيعية أو اللغة الحرة.
فصول الدراسة
تتكون الدراسة من مقدمة منهجية وعشرة فصول فضلاً عن الخاتمة التى تشتمل على النتائج والتوصيات ، و ستة عشر (16) ملحقًا يضم العديد من المرفقات التى تخدم هذه الدراسة.
المقدمة
وتأتى المقدمة المنهجية لتوضح أهمية الدراسة وأهدافها وحدودها ثم الفروض التى تحاول هذه الدراسة اختبارها ، فالمنهج الذي اتبعته ، يأتي بعده الحديث عن عينة الدراسة ومصادرها ، ثم محاولة التعرف على مجالات الإفادة من نتائج الدراسة ، ثم تختتم المقدمة بعرض موجز لمحتويات الدراسة وفصولها.
الفصل الأول : أدب الموضوع
يحاول الباحث فى هذا الفصل تقديم نظرة شاملة على أدبيات موضوع الدراسة موضوحًا فى البداية أن القضية محور الدراسة ، وهى قضية استرجاع المعلومات باللغة العربية هي قضية لغوية حاسوبية معقدة يتجاوز أبعادها علم المكتبات والمعلومات ، فتلك القضية ذات جوانب متعددة تشكل جوانبها نسيجًا متداخلاً من علم المعلومات والحاسوب واللغويات وعلم المكتبات والإحصاء .... وغيرها. ثم ينتقل فى هذا الفصل إلى بحوث الإنتاج الفكري التي قام بها الباحث فى مراصد البيانات العالمية والعربية لتجميع مفردات الإنتاج الفكري التى ركزت على هذه القضية ، وكان من نتيجة هذا الحصر أنه اتضح للباحث مدى الاهتمام بنظم استرجاع المعلومات وتقييمها بوجه عام ، وموضوع معالجة اللغة الطبيعية فى نظم استرجاع المعلومات بوجه خاص.
الفصل الثاني : نظم استرجاع المعلومات ؛ الماهية ، والأنواع ، والأنشطة
يحاول هذا الفصل إلقاء الضوء على نظم استرجاع المعلومات كوسيلة للتغلب على مشكلة المعلومات بجوانبها المختلفة ؛ والتي تعد أبرز ملامحها تضخم الإنتاج الفكري ، ثم يركز هذا الفصل على محاولة التعرف على مكان نظم استرجاع المعلومات بين مختلف نظم المعلومات بشكل عام ، ثم ينتقل ليقدم وجهات النظر المختلفة لأنواع نظم استرجاع المعلومات وبيان الفروق بين تلك الرؤى المختلفة ، ثم يحاول الفصل الوصول إلى تعريف إجرائي لنظم استرجاع المعلومات العربية ، ثم يعرج الفصل إلى بيان الأنشطة المختلفة التي تمارسها نظم استرجاع المعلومات مع التطرق إلى المعالجة الفنية لأوعية المعلومات بالتركيز على المعالجة الموضوعية لهذه الأوعية بمراكز المعلومات.
الفصل الثالث : لغات التكشيف واللغة الطبيعية فى نظم استرجاع المعلومات
يحاول الفصل الوقوف على التعريفات المختلفة للغات التكشيف ، ومن ثم محاولة الوصول إلى تعريف إجرائي للغة التكشيف ، ثم التعرف على المكونات المختلفة لها ، واستعراض وجهات النظر المختلفة لأنواع لغات التكشيف ، مع التركيز على اللغة الطبيعية كأحد نوعين رئيسيين للغات التكشيف ، ثم التطرق إلى ميزات اللغة الطبيعية ، ودواعي استخدامها ، ثم يختتم هذا الفصل بدراسة لمجالات استثمار الحاسب الآلي واللغة الطبيعية فى نظم استرجاع المعلومات .
الفصل الرابع : تصميم مرصد عربي معتمد على اللغة الطبيعية
نموذج تطبيقي تجريبي؛ يبرز هذا الفصل محاولة الباحث نحو تصميم مرصد بيانات عربي لاسترجاع البيانات الوراقية ، يعتمد أساسًا على اللغة الطبيعية كمفاتيح للاسترجاع يتم من خلالها استرجاع التسجيلات الوراقية بالمرصد ، وقد بدأ هذا الفصل بمحاولة تعريف مراصد البيانات وبيان الفرق بينها وبين بنوك المعلومات ، ثم تناول منظومة برمجيات WINISIS التي تم الاعتماد عليها فى بناء مرصد البيانات التجريبي الذي أعد لأغراض هذه الدراسة ، ممهدين لذلك بلمحة تاريخية عن النظام ، ثم إصداراته المختلفة ، ومستخدميه فى الدول النامية والمتقدمة وفى مقدمتهم مصر ، ثم ينتقل الفصل إلى استعراض وظائف هذه المنظومة ومميزاتها ومبررات استخدامها ، ثم يقدم الفصل تعريفاً مختصراً لشكل (فما –21 : MARC-21) الذي وقع الاختيار عليه كمعيار تم الاعتماد عليه لإعداد بنية التسجيلة الوراقية ، والذي يعد أحدث أشكال تبادل التسجيلات الوراقية على مستوى العالم ، كما أنه يعد فى الوقت نفسه أشهرها وأشملها وأكثرها انتشارًا. ثم يختتم الفصل بوصف عام لمرصد البيانات التجريبي ، موضحًا فيه ملفات تعريف مرصد البيانات ، والتي تشتمل على: جدول تعريف الحقول ، واستمارة إدخال البيانات، وجدول اختيار الحقول ، وأشكال العرض المختلفة ، مع دعم ذلك بالأمثلة والنماذج.
الفصل الخامس : الدلالة الموضوعية للعناوين
يحاول هذا الفصل دراسة الدلالة الموضوعية للعناوين ومدى التعويل عليها كمصدر للتعبير الموضوعي عن الوثائق ، هذا وقد سيق حجج المعارضين لهذا الاتجاه والردود المختلفة على تلك الاعتراضات مدعمين ذلك بالأمثلة والنماذج ، ثم يختتم الفصل بذكر بعض التدابير التي من شأنها الارتفاع بالدلالة الموضوعية للعناوين ؛ منها ما هو موجه للمؤلفين أنفسهم عند صياغتهم لعناوين وثائقهم ، ومنها ما هو موجه لمنظمي المؤتمرات العلمية ورؤساء تحرير الدوريات المتخصصة.
الفصل السادس : قائمة الاستبعاد
يتناول هذا الفصل قائمة الاستبعاد ودورها في نظم استرجاع المعلومات. ويبدأ هذا الفصل بتعريف قائمة الاستبعاد ، والفرق بينها وبين قائمة الاعتبار، ومحاولة الإجابة على تساؤل : ما هي مكونات قائمة الاستبعاد ؟ ، وما هي المتغيرات المختلفة التي تؤثر على قائمة الاستبعاد ؟. ثم ينتقل الفصل إلى جانب تطبيقي ، يتعلق بمصادر حصر قائمة الاستبعاد ؛ منها ما ينتمي إلى الدراسات اللغوية ، ومنها ما ينتمي إلى دراسات المعلومات ، ثم يختتم الفصل بملاحظات عامة على قائمة الاستبعاد.
الفصل السابع : الترادف
يحاول هذا الفصل معالجة قضية الترادف كأحد الظواهر الدلالية التى تؤثر على نظم استرجاع المعلومات بوجه عام ، وعلى لغات التكشيف بوجه خاص ، ويحاول هذا الفصل إلقاء الضوء على الترادف كظاهرة لغوية من خلال تعريفها ورصد اتجاهات اللغويين فى دراستها ، موضحين فى ذلك الخلاف الذي نجم بينهم بشأن هذه القضية ما بين منكر لها ومثبت ، ومدى تأثير ذلك على لغات التكشيف، عارضين فى ذلك سبل مواجهة اللغات المقيدة لهذه الظاهرة. ثم إلى قضية معالجة المترادفات فى النظم التى تعتمد على اللغة الطبيعية. ثم فى نهاية الفصل نتساءل ألا من حل لهذه المشكلة ؟ الا من سبيل للسيطرة على تلك الظاهرة؟ ونختتم هذا الفصل بمحاولة لوضع برنامج فرعي لمعالجة المترادفات يعتمد على قائمة بالمترادفات تم تجميعها من مصادر مختلفة.
الفصل الثامن : الاشتراك اللفظي
يركز هذا الفصل على القضية الدلالية الثانية التي تؤثر على نظم استرجاع المعلومات ؛ وهى قضية الاشتراك اللفظي. ويحاول هذا الفصل الوقوف على حقيقة هذه الظاهرة ومعرفة أسبابها ومصادرها ومن ثم تأثيرها على نظم استرجاع المعلومات ، ثم التركيز على قضية المشترك اللفظي الصناعي التي تنجم عن تجاهل علامات الشكل فى العربية مما يؤدى إلى كثير من المشكلات. ثم ينتقل الفصل ليغطى سبل مواجهة اللغات المقيدة لهذه الظاهرة ثم طريقة التغلب عليها فى النظم المعتمدة على اللغة الطبيعية ، والتي تعتمد أساساً على دور السياق فى ذلك.
الفصل التاسع : السوابق اللغوية
يتناول هذا الفصل السوابق اللغوية أو البادئات وما يتعلق بها من مشكلات تؤثر بدورها على الاسترجاع ، مع التمهيد لهذا الفصل بتعريف للسوابق اللغوية ودورها الوظيفي فى اللغة العربية ، ثم ينتقل الفصل للتركيز على إشكالية السوابق فى نظم استرجاع المعلومات مدعمين ذلك بالعديد من الأمثلة والنماذج ، ثم يركز الفصل على واو العطف كمشكلة مركبة من مشكلات اللغة العربية. ثم يختتم الفصل بمحاولة لوضع برنامج فرعي لمعالجة السوابق يعتمد أساساً على قائمة استثناء تضم جميع الكلمات التي تبدأ بحروف السوابق .
الفصل العاشر : ( أل ) التعريف ومشكلاتها
يعالج هذا الفصل مشكلة (أل) التعريف وتأثيرها على نظم استرجاع المعلومات ، حيث يبدأ الفصل بتعريف هذه المشكلة ، ورصد مشكلات (أل) الأصلية والتباساتها فى العربية ، ثم ينتقل الفصل لسرد الحلول المقدمة لمشكلة (أل) التعريفية ، ثم يختتم الفصل بمحاولة لوضع برنامج فرعي لمعالجة مشكلة (أل) التعريف معتمداً بشكل أساسي على قائمة استثناء تضم جميع الكلمات التي تبدأ بالحرفين الألف واللام تم تجميعها من مصادر مختلفة.
الافادة من نتائج الدراسة
وجدير بالذكر في هذا السياق – وقبل أن نتطرق إلى مجالات الإفادة من نتائج الدراسة- أن نؤكد على أن الدراسة الحالية لا تتحمس للمفاضلة بين اللغة الطبيعية واللغة المقيدة ، كطريقتين متمايزتين للتعبير الموضوعي في مراصد البيانات العربية ، محاولين ألا ننجرف إلى محاولة محمومة لإيجاد الدلائل والبراهين على أن اللغة الطبيعية تتفوق على نظيرتها في كفاءة الاسترجاع ، فهذه عملية قد حُسِمًتْ منذ زمن ؛ وإنما نطمح للتكامل بين النوعين معًا ، في محاولة منا للارتفاع بكفاءة النظم التي تعتمد على اللغة الطبيعية ؛ أو حتى تريد أن تعتمد عليها، ذلك لإن استرجاع البيانات عبر اللغة الطبيعية لا يتضمن أى تكلفة إضافية يتحملها مركز المعلومات ، ولا يحمل مركز المعلومات أى جهد إضافي ، فالعنوان والمستخلص ومقتطفات النصوص يتم إدخالهم في التسجيلة الوراقية دون أدنى جهد يذكر من أخصائي المعلومات ، وبالتالي فإن الاسترجاع عبر هذه العناصر (الحقول) السالفة الذكر يعد قيمة مضافة لمركز المعلومات.
وبتحقيق الارتفاع المأمول في كفاءة النظم المعتمدة على اللغة الطبيعية ، تتحقق الإفادة التي نطمح إليها ، وبالتالي تقديم خدمة متميزة للمستفيد النهائي.
ومن هنا يمكن الإفادة من النتائج التي ستنتهي هذه الدراسة إليها ، فيما يلي :
- تطوير محركات البحث وواجهات البحث المعتمدة على اللغة الطبيعية ، سواءً أكانت نظم للبحث عن وثائق (مراصد بيانات) ، أو نظم للبحث عن حقائق (بنوك معلومات).
- تطوير محركات البحث العربية عموما ، ومحركات البحث على الإنترنت بوجه خاص ، بما يتلائم وخصائص اللغة العربية.
النتائج والتوصيات
النتائج
تكشف للباحث من خلال هذه الدراسة أنه ليس هناك قصورًا في اللغة العربية ذاتها، فاللغة العربية كباقي اللغات صالحة للاستخدام على كافة المستويات العلمية والتقنية ؛ ولكن بدا ذلك واضحًا جليًا في كل خطوات هذه الدراسة. فالعربية صالحة لأن تكون لغة للمدخلات ، كما أنها صالحة أيضا لأن تكون لغة للمخرجات ، ولكن الأمر لا يقتصر على ذلك فحسب... إذ يجب فهم خصائص اللغة العربية ، ودقائقها الأصيلة ، وذلك لرفع كفاءة الاسترجاع.
ومن أمثلة القضايا التي تثيرها العربية والتي تقف كحجر عثرة في طريق تحقيق كفاءة الاسترجاع ، بعض القضايا الدلالية للغة ؛ مثل : الترادف والاشتراك اللفظي.
وقد أمكن التغلب على مشكلة المترادفات من خلال برنامج مبسط يقوم بتوليد المترادفات المختلفة لكلمة البحث ، معتمدا في ذلك على ملف مسبق الإعداد يدعى "ملف المترادفات" وهو ملف مساعد لبرنامج معالجة المترادفات ويقوم عليه بشكل أساسي ، ومن خلال هذا البرنامج المقترح يمكن استرجاع المعلومات المتعلقة بمفهوم ما ، على اختلاف صور هذا المفهوم.
أما إشكالية الاشتراك اللفظي وما يصاحبها من تطور دلالي للكلمات ، فإنه يمكن التغلب عليها من خلال إمكانيات البحث المتقدمة ، والتي تتيح البحث من خلال السياق المصاحب للكلمة محل البحث، وذلك باستخدام إمكانيات البحث بالتجاور والتقارب.
أما مشكلات السوابق والتي تدخل على الكلمة العربية فتغير من الرسم الإملائي للكلمة ، ومن بينها (أل) التعريف ، وحروف الجر المتصلة ... وغيرها. وقد أمكن التغلب على تلك المشكلات من خلال تصميم برنامج لتوليد كافة الأشكال المختلفة للكلمة، أو بمعنى آخر جميع صور الكلمة ؛ سواء كانت مجردة أو يلتصق بها أحد حروف السوابق.
أما فيما يتعلق بمعالجة مشكلة (أل) التعريفية التي أثارت لغطًا كثيرًا فيما قبل. فقد تم تصميم برنامج لمعالجة هذه المشكلة ، من خلال الاعتماد على ملف مساعد ؛ يشتمل على الكلمات التي تبدأ بحرفي الألف واللام الأصليتين ، ومن خلال مضاهاة تعبير البحث بهذا الملف المساعد ، يتم معرفة إلى أي فئة تنتمي الكلمة. على هذا المنوال يتم إجراء البحث بالصورتين المحتملتين للكلمة (مجردة - معرفة).. وبالتالي ترتفع كفاءة الأداء.
أما عن قائمة الاستبعاد وما لها من دور إيجابي في حالة وجودها ضمن مكونات نظام استرجاع المعلومات بوجه عام ، ولما لها من دور رئيسي في تقليص مداخل الملف المقلوب لتلك الكلمات غير ذات الدلالة.
هذا وقد تابع الباحث قضية قائمة الاستبعاد ، وذلك للحصول على أكبر قدر ممكن من المفردات التي يمكن أن تنطوي عليها قائمة الاستبعاد العربية، وقد سلك الباحث في هذا الصدد العديد من السبل؛ أهمها : الدراسات اللغوية والإحصائية ، وقوائم الكلمات الأكثر تكرارًا في مراصد البيانات، وقوائم الاستبعاد لمراصد بيانات متعددة ... هذا فضلا عن تفحص الملف المقلوب ذاته لمرصد البيانات التجريبي الذي أعد لأغراض هذه الدراسة.
وفي ختام هذه النتائج يجب التأكيد على أن اللغة الطبيعية لا تقل في كفاءتها عن اللغات المقيدة ، ولكن الأولى تحتاج إلى ضبط ، فهي تشبه الفيضان الذي نقيم السدود والقنوات عليه لاستثماره ، ولا نستطيع في الوقت ذاته الوقوف أمامه.
التوصيات
- ضرورة حث المؤلفين بكافة الطرق على إبراز العناصر الموضوعية الدالة في عناوين مصنفاتهم، وضرورة البعد عن صيخ المبالغة ، والسجع والمحسنات البديعية ... التي يستخدمها بعض المؤلفين والناشرين لأغراض الجذب والتشويق والتسويق.
- التأكيد على ضرورة استخدام المصطلحات اللغوية التي اعتمدتها مجامع اللغة العربية في عناوين الوثائق أثناء صياغتها.
- تشجيع القائمين على مراصد البيانات على نشر خبراتهم الخاصة في هذا الملف ، وعلى وجه الخصوص : وثائق تصميم مرصد البيانات ، وبنية الملفات ، والعلاقة بينها ، والملفات الأساسية والمساعدة ، وعلى رأسها قائمة الاستبعاد ، وقائمة المترادفات ، وقائمة الاستثناءات ... وغيرها.
- ضرورة الاهتمام بدراسة والتدريب على قواعد اللغة العربية ، وبخاصة الهمزات ، ونقطتي الياء ... وغيرها من القضايا الإملائية ، ويعد هذا الأمر من المؤهلات اللازمة لمدخلي البيانات بمراصد البيانات العربية ، ويمكن في هذا الشأن تنظيم دورات أو برامج تدريبية للارتفاع بالمعرفة والوعي بهذه القضايا ، والتي يغفلها الكثيرين إما متعمدين ، وإما جهلا بها ، أو سهوًا.
- ضرورة استخدام البرامج التي صممها الباحث للتغلب على مشكلات : السوابق ، و(أل) التعريفية، والمترادفات للارتفاع بمعدلات الأداء بمراصد البيانات.