سنڌو لکت جي ڀاڃ تي لکيل مختلف ليکڪن جا ٽي مقالا سنڌيڪار: رشيدالله زهراڻي

'مقالا' فورم ۾ رشيد الله زهراڻي طرفان آندل موضوعَ ‏20 سيپٽمبر 2018۔

  1. رشيد الله زهراڻي

    رشيد الله زهراڻي
    سينيئر رڪن

    شموليت:
    ‏10 مارچ 2013
    تحريرون:
    5
    ورتل پسنديدگيون:
    2
    ايوارڊ جون پوائينٽون:
    143
    سنڌو لکت جو مارڪوفِي ماڊل


    راجيش پي.اين رائو (a,1)، نِيشا يادئو (b,c)، مينِڪ اين. واهيا (b,c)، هرِيشيشَڪ جوگليڪر، آر. اَڌِيڪاري، ۽ اِرواٿن مهاديون


    (الف) ڪمپيپٽر سائنس ۽ انجنيرنگ وارو شعبو، يونيورسٽي آف واشنگٽن، سيِئاٽل،WA 98195 (ب) علم فلڪيات Astronomy ۽ ايسٽرو فزڪس Astrophysics (فلڪيات جي هڪڙِي شاخ جيڪا طبيعات ۽ ڪيميا سان واسطو رکي ٿي)، ممبئي جو بنيادي تحقيق وارو ادارو ٽاٽا 400005، هندستان. ڌَس وادي، لڪشمِي نِڪيتَن، ٺاڪُردُوار، ممبئي، 400002, هندستان. شمارياتي سائنسن جو شعبو، چينائِي 600113، هندستان ۽ انڊس رسرچ سينٽر (سنڌو سڀيتا جو انُوسنڌانِي ڪيندر (تحقيقي مرڪز) ) ۽ روجا مُٿيا انُوسنڌاني پُستڪالي پَرِيچر، چينائِي، 600113، هندستان ( روجا مُٿيا تحقيقي ڪتُب خانو، چينائي، هندستان).


    جيتوڻيڪ سنڌو سڀيتا (2600 ق.م کان 1900 ق.م تائين) جي باري ۾ ڪا به مستند تاريخي معلومات ميسر ناهي پر پوءِ به آثارِ قديمه جي ماهرن 3،800 جي لڳ ڀڳ هڪڙي لپِيءَ جا ننڍڙا نمونا دريافت ڪيا آهن جيڪا ان سموري تهذيب ۾ ڪتب آندي ويندي هئي. گذريل 80 اسي سالن جي عرصي کان وٺي وڏي پئماني تي ڪيل ڪوششن ۽ دعوائن جي باوجود به اها لپي هن محل تائين اڄاتل سمجهي وڃي ٿي. هتي، اسان سنڌو لکت جي چڪاس واسطي احتمالي نمونن جي استعمال جي تجويز پيش ڪري رهيا آهيون.

    ان جو بنيادي مقصد آهي ته ان احتمالي چڪاس وسيلي، نحوِي نمونن کي وائکو ڪيو وڃي جيڪي ان جي ڀاڃ جي نتيجي جي نشاندهي ڪري سگهندا هجن. اسان ان لکت جي ڀاڃ واسطي سادي مارڪوف چين ماڊل ( مارڪوف جي زنجيري/ ڪَڙيدار نموني) کي ڪتب آندو آهي ته جيئن سنڌو لکت ۾ سندس نشانين جي درميان ترتيبوار ايندڙ دارومدار کي پڪڙي سگهون. هن نموني جي سکيا وسيلي نئين نموني وارو متن جنم وٺندو، جنهن سان نشانين جا ورجايل نمونا پڌرا ٿي پوندا جيڪي ٿي سگهي ٿو ته ڪنهن بنيادي ٻولي جي ڪنهن وڏي مرڪب جي نمايان ۽ ڪارآمد جزي جي صورت اختيار ڪري وڃن. هي نمونو هڪڙي اهڙي آزمائشي طريقي جي پٺڀرائي پڻ ڪري ٿو جنهن جي وسيلي ان عمل جي مقداري چڪاس پڻ ڪري سگهجي ٿي ته آيا ڪا مخصوص ڏوري String جهڙي نموني مارڪوف ماڊل ذريعي هٿ ڪئي ويئي آهي اها ان فرضِي ٻولي سان واسطو رکي به ٿي يا نه.

    ميسوپوٽاميه ۽ اولھ ايشيا جي مختلف هنڌن تان مليل سنڌو تهذيب وارين مهرن تي هن آزمائش جي اطلاق مان معلوم ٿئي ٿو ته هيءَ لپي انهن خِطن ۾ مختلف موادن جي اظهار واسطي ڪتب آندي ويندي هئي. آخر ۾ ، اسان ڏيکارينداسين ته ڀڳل ٽٽل سامان تي نظر ايندڙ گم ٿي ويل، مبهم، ۽ پڙهڻ ۾ نه ايندڙ نشانين کي هن ماڊل جي مدد سان ڪافي امڪاني طريقي سان ڪهڙي نموني سان پُر ڪري سگهجي ٿو. هڪ لڱا، اسان جا نتيجا نشاندهي ڪري رهيا آهن ته سنڌو لکت نحوي جوڙجڪ سان لبريز آهي ۽ ان ۾ مختلف مواد کي پڌرو ڪرڻ جي صلاحيت موجود آهي. اهي ٻئي عمل ان جي بجاءِ غيرلساني علامتي سرشتي جي ڪنهن لساني لکتي سرشتي تي مشتمل هجڻ جي تصديق ڪن ٿا .

    سنڌو سڀيتا (يا هڙاپا جي تهذيب) تيزيءَ سان (2600 ق.م کان 1900 ق.م) تائين موجوده پاڪستان ۽ اُتر اولھ هندستان واري ايراضي تي وڌي ويجهي. ان جو تجارتي دائرو ايراني نار ۽ وچ ـ اوڀر تائين ڦهليل هو. هيءَ تهذيب ماضيءَ جي نهايت قديم گهراين مان تنهن وقت نمودار ٿي جڏهن اليگزينڊر ڪننگهام (1814 ـ 1893ع) ۾ هڪڙي ماڳ جو سئير ڪيو جنهن کي هڙاپا جي نالي سان ڪوٺيو وڃي ٿو ۽ ان جي وضاحت کي شايع ڪيو (1)، جنهن ۾ هڪڙِي ننڍڙي مهر جو خاڪو پڻ شامل ٿيل هو جنهن تي اڄاتل حرف اڪريل هئا، جنهن کانپوءِ سنڌو سڀيتا بابت آثارِ قديمه جي ماهرن طرفان ڪافي ڪجھ لکيو ويو آهي ( جائزي لاءِ ڏسو حوالو 2 ۽ 3)، پر اها لکت اڄ ڏينهن تائين ڳجهارت بڻيل آهي.

    سنڌو لکت جون 3،800 جي لڳ ڀڳ ٺپي واريون مهرون، مهربندون، تعويذ ۽ ننڍڙيون تختيون کوٽي هٿ ڪيون ويون آهن ( مثال خاطر ڏسو 1A واري تصوير کي)، جيتوڻيڪ ان لکت جي ڀاڃ بابت اندازاََ 60 دعوائون سامهون آيون آهن (4) ، پر حلقي پاران انهن مان ڪنهن کي به تسليم نه ڪيو ويو آهي. هن لکت جي ڀاڃ ۾ ستن قسمن جون مشڪلاتون معلوم ڪيون ويون آهن (4) جن ۾ ڪن به ٻن ٻولين جي کوٽ، نقشن جو ننڍپڻو ( سراسري طور تي ڪنهن نقش جي طوالت پنجن 5 نشانين تي مشتمل آهي) ۽ ٻيو ته اسان مڪمل طور تي ان تهذيب ۾ ڪتب ايندڙ ٻولي / ٻولين کان صفا اڻڄاڻ آهيون وغيره شامل آهن.

    سڌي سئين نموني ڀاڃ ڪرڻ واسطي پيش ايندڙ اهڙي قسم جي ڀيانڪ رڪاوٽن کي مد نظر رکندي اسان سڌي سئنين ڀاڃ جي طريقيڪار بجاءِ ان لکت جي نحوي جوڙجڪ کي ڪِلي (مشيني) سکيا ۽ شمارياتي نمونن جي چڪاس واري ميدان جي استعمال جي تجويز ڏيون ٿا. اسان کي يقين آهي ته ان قسم جي پهچ اسان کي ان لکت جي وياڪرڻ واري جوڙجڪ بابت ڪارآمد بصيرت مهيا ڪري سگهندي، جنهن سان ممڪن ڀاڃ واسطي رستو صاف ٿي ويندو.

    هن قسم جي ڪوشش جي پهرين ڏاڪي واسطي، اسان هتي اهي نتيجا پيش ڪري رهيا آهيون جيڪي اسان سنڌو لکت جي ترتيبوار جوڙجڪ جي چڪاس مان سادي قسم جي امڪاني گرافيائي ماڊل (6) وسيلي حاصل ڪيا آهن جنهن کي مارڪوف جو ماڊل چيو وڃي ٿو(7).

    مارڪوف ماڊل فرض ڪري ٿو ته موجوده حالت ( ڪنهن متن ۾ ڏنل علامت) اڳوڻي حالت تي دارومدار رکي ٿي، هي هڪڙو اهڙو مفروضو آهي جيڪو نه صرف سکيا فراهم ڪري ٿو پر ان سان گڏوگڏ قابلِ مرتب سلسسلن منجهان نتيجو پڻ ظاهر ڪري ٿو. جيتوڻيڪ هي مفروضو ٻولين ۾ نظر ايندڙ پيچيده متواتر بناوت جو اختصار آهي، مارڪوفي نمونا وڏي پئماني تي ترتيبي اعدا وشمار جي چڪاس واسطي ڪارآمد ثابت ٿيا آهن جنهن ۾ ڳالھ ٻولھ (8) ۽ فطرتي ڀاشا شامل آهن. هن جاءِ تي اسان انهن کي سنڌو لکت تي لاڳو ڪيون ٿا. هن ڪالم جو اهم ڪارڻ انهن فردن لاءِ مارڪوفي ماڊل جي نمائش ڪرڻ آهي جيڪي ان کان اڻڄاڻ آهن ۽ ان جي اهميت کي اڻ ـ ڀڃيل لپيءَ جي مطالعي لاءِ مثالن سان سمجهائڻ وارو آهي. اسان وڌيڪ ترقي يافته نمونن ۽ وياڪرڻي مقررين وارن طريقيڪارن کي مستقبل جي ڪم ڪار واسطي ٻين صفحن (10) لاءِ مُختص ڪيو آهي.

    سنڌو لکت لاءِ ڏنل مارڪوفي ماڊل:

    مارڪوفي ماڊل جنهن کي مارڪوفي زنجيري / ڪڙِيدار ماڊل پڻ چيو ويندو آهي (7، 11، 12) N اين وارين ”حالتن“ واري عمدي جوڙي تي مشتل هوندو آهي يعني S1, S2 )…..SNمثال طور، اهي حالتون لپِيءَ ۾ موجود نشانيون ٿي سگهن ٿيون) ۽ هڪڙو مشروط (نقل مڪاني ڪندڙ) احتمالي جوڙو ( P(si sj جيڪو ان ڳالھ جو تعين ڪري ٿو ته si واري حالت جو sj واري حالت ۾ اچڻ جو ڪيترو امڪان آهي. ان کان علاوه، هڪڙو ( P(si پيشگي وارو جوڙو پڻ موجود آهي جيڪو ان امڪان کي واضع ڪري ٿو ته si واري حالت ڪنهن ترتيب جو آغاز ڪري ٿي. 1B واري تصوير ”حالت واري خاڪي“ جومارڪوفي ماڊل لاءِ مثال ڏيکاري ٿي جنهن ۾ A, B ۽ # ڏنا ويا آهن جنهن ۾ اي ۽ بي ڪنهن ٻوليءَ ۾ موجود حرفن جي نشاندهي ڪن ٿا ۽ # ڪنهن متن جي انت جي نشاندهي ڪري ٿو. 1B وارو خاڪو پهريان وارن امڪانن کي پڻ ڏيکاري ٿو يعني ( P(si ۽ نقل مڪاني ڪندڙ امڪان يعني (P(si sj، جيڪي هتي مثالن واسطي اڍنگي نموني منتخب ڪيا ويا آهن. هن مارڪوفي ماڊل وسيلي پيدا ڪيل ڪجھ ترتيبي مثال هي آهن يعني،

    BAAB, ABAB, B, وغيره. آخري نشاني # نه ڏيکاري ويئي آهي.

    اهي متن جيڪي هن مارڪوفي ماڊل وسيلي پيدا نه ڪيا ويا آهن انهن ۾ اهي سمورا متن شامل آهن جن ۾ …(B (…BB جو ورجاءُ ڪيو ويو آهي ۽ اهو سمورو متن جيڪو A تي ختم ٿئي ٿوڇاڪاڻ جو اهو نقل مڪاني ڪرڻ واري امڪاني ٽيبل پاران خارج ڪيا ويو آهي. مارڪوفي ماڊل جو وڌيڪ حقيقت پسنداڻو مثال 26 حرفن ۽ وٿين سميت انگريزي ٻولي وارو متن آهي . هن صورت ۾ نقل مڪاني ڪرڻ واري امڪاني ٽيبل (يا ميٽرڪس Matrix = حالتن جو اهڙو جوڙ جيڪو ڪو سرشتو مهيا ڪري جنهن منجھ ڪا شيءِ وڌڻ ويجهڻ شروع ڪري) ٽيبل 27 27 واري حجم جيتري بيهندي. مثال طور، ميٽرڪس تحت، اسان حرف ”s“ بابت اعليٰ درجي وارن اهڙن امڪانن جي توقع ڪري سگهون ٿا جن تحت ان حرف جي پويان انگريزي جي لفظن جي صُورتي بناوت جي سبب سُتت ئي هن قسم جا حرف اچن ٿا يعني” e,’’ ‘‘o,“ يا ”u“، بجاءِ هنن حرفن جي جهڙوڪ “x“ يا ”z“ وغيره. انگريزي ڀاشا جي جسد واري متن مان مارڪوف ماڊل ذريعي حاصل ڪيل سکيا وسيلي اهڙي قسم جا شمارياتي ضابطا پڪڙي سگهجن ٿا.

    مارڪوفي ماڊل (۽ ان جا ملھ مٽيندڙ، ڳُجها مارڪوفي نمونا يعني (HMMs) امڪاني نمونن جي ڪافي عام درجن جون خاص صورتون آهن جن کي گرافيائي نمونن طور ڄاتو وڃي ٿو (6). گرافيائي نمونن کي حالتن درميان پيچيده تعلقاتن جي ماڊل / نموني طور واپرائي سگهجي ٿو، جنهن ۾ اعليٰ ـ درجي وارن انحصارين جهڙوڪ ڪنهن علامت جي گذري ويل N-1 واري علامت تي دارومداري ( جيڪا ٻوليءَ جي نموني سازي ۾ اين ـ گرام N-gram جي برابر آهي (9). هن ڪالم ۾ ، اسان پهرين درجي واري مارڪوفي ماڊل تي ڌيان ڌري رکنداسين. ٻئي ڪم ۾ (10)، اين ـ گرام ماڊل کي سنڌو لکت جي متن لاءِ معلوماتي ـ نظرياتي پئماني جي ”مُونجھ“ لاءِ ڀيٽيو آهي (9). اسان معلوم ڪيو آهي ته سنڌو لکت جي متن جي گهڻي تڻي مونجھ کي ڪنهن (n 2) واري بائيگرام bigram (يا مساوي طور تي، پهرين درجي واري مارڪوفي ماڊل) وسيلي پڪڙي سگهجي ٿو، سنڌو لکت جي چڪاس واسطي ان قسم جي نمونن جي ڪارآمد هئڻ جي تصديق ڪجي ٿي.

    (ڪو بائيگرام bigram يا ڊائيگرام diagram ٻن ويجهن عنصرن جو ڪنهن اِسٽرنگ string جي ٽوڪنن tokens (هيءَ خالصاََ ڪمپيوٽر جي ٻولي آهي) جو سلسلو آهي، جيڪو خاص طور تي حرف، پد، يا وري ڪو لفظ به ٿي سگهي ٿو بائيگرام bigram اين برابر آهي ٻن جي n=2 جو اين گرام n-gram آهي. ڪنهن اِسٽرنگ ۾ هرهڪ بائيگرام جي تڪراري تعداد frequency جي ورهاست عام طور تي متن جي ڪيترن ئي واهپن ۾ عام طور تي سادي شمارياتي چڪاس واسطي ڪتب آندو ويندو آهي، جنهن ۾ شمارياتي لسانيات Computational Linguistics، رمز نويسي Cryptography، آواز جي سڃاڻپ Speech Recognition وغيره پڻ شامل هوندا آهن، وِٿي رکندڙ بائيگرام يا بولاٽيون کائنيدڙ بائيگرام لفظن جا اهي جوڙا هوندا آهن جيڪي وٿين جي اجازت ڏيندا آهن ( شايد جوڙيندڙ لفظن کان لنوائيندي يا دارومدارن جو ڍونگ رچائيندي جيئن دارومداري وياڪرڻ وغيره.

    سربراه لفظ وارا بائيگرام وٿين وارا بائيگرام هوندا آهن جيڪي هڪڙي واضع دارومداري تعلق ساڻ هوندا آهن. بائيگرام پهرين ٽوڪن جي موجودگي ۾ مشروط امڪان جي تعلق کي لاڳو ڪرڻ بعد ان مشروط امڪان جي دستيابي جي سهائتا ڪندا آهن.

    ڪمپيوٽر پروگرامنگ تحت اسٽرنگ String روايتي طور تي ڪنهن خاصيت جو سلسلو آهي جيڪو مستقل اصل يا ڪنهن ملھ مٽيندڙ جي نموني وارو هوندو آهي. بعد وارو پنهنجي عنصرن کي تبديل ٿيڻ ۽ پنهنجي ڊيگھ وڌائڻ لاءِ ڇڏي ڏيندو آهي، يا وري اهو (تخليق ٿيڻ بعد) هڪ هنڌ تي ڄمي بيهي سگهي ٿو. ( وِڪِي پيڊيا جي مدد سان، مترجم).

    هن ڪالم ۾ سنڌو لکت جي جائزي لاءِ مارڪوفي نمونن جي ٽن واهپن تي ڌيان ڌرينداسين : (1) نموني سازي: اسان ڏيکارينداسين ته پهرين امڪان واري ورهاست مان بي ترتيب نموني سازي ( P(si جي ورهاست وسيلي نوان نمونا ڪيئن پيدا ڪري سگهجن ٿا ته جيئن اسٽرنگ واري نشاني جنهن کي ( S1) ڪوٺجي ٿو کي حاصل ڪري سگهجي جنهن کانپوءِ نقل مڪاني ڪندڙ امڪانن واري نشاني ( P(si S1 ۽ وري ٻي نشاني S2 کي حاصل ڪجي ۽ اهڙي طرح اهو سلسلو هلندو رهي.

    متن ۾ هن قسم جي نشاني (EOT) جي اختيار ڪرڻ سان اسٽرنگ جي پيداواري عمل کي ختم ڪري سگهجي ٿو، اها نشاني پنهنجو پاڻ کي پهرين امڪان ڏانهن منتقل ڪري ٿي. جيڪڏهن ايل L ڊيگھ جو اسٽرنگ آهي ۽ ان جو نمونو x1x2…xL آهي، جتي xi نشانين جي فهرست منجهان هڪڙي نشاني آهي ته پوءِ x جي مارڪوف واري ماڊل ايم M مان پيدا ٿيڻ واري امڪان جي شماريات هيئن بيهندي:

    P(xM) P(x1x2…xLM) P(x1)P(x2 x1) P(x3 x2)…P(xL xL-1)

    ڪنهن مخصوص ماڊل ۾ ڪنهن اسٽرنگ جو امڪان اسان کي ٻڌائي ٿو ته ڪنهن مليل اسٽرنگ جون شمارياتي خاصيتون اصلي اسٽرنگن سان ملن ٿيون جيڪي مليل ماڊل جي سکيا واسطي ڪتب آنديون وينديون هيون.

    تنهنڪري، جيڪڏهن اصلي اسٽرنگون ڪنهن مخصوص ٻولي جي شماريات مطابق پيدا ڪيون ويون هيون، ته ان جو امڪان هي معلوم ڪرڻ لاءِ ڪارآمد آهي ته ڪو مليل اسٽرنگ شايد ساڳي ٻولي پاران پيدا ڪيو ويو آهي.

    (3) گم ٿيل نشانين کي پُر ڪرڻ :

    مارڪوف جي ايم M واري سِکيل ماڊل جي مفروضي ۽ هڪڙي درآمدِي ( input) ايڪس x واري اسٽرنگ ۾ موجود ڄاتل سڃاتل نشانين ۽ ڪجھ گم ٿيل نشانين جي معلومات سميت ڪو به امڪاني طور تي ڪافي مڪمل اسٽرنگ x* بابت (MPE) جي شمار وسيلي اسٽرنگ جي نامعلوم حصن واسطي ڪافي امڪاني وضاحت جو تخمينو ڪري سگهي ٿو (تفصيل واسطي طريقيڪارن کي ڏسو).

    سنڌو لکت: ڪنهن به لکت جي ترتيبوار جوڙجڪ کي سمجهڻ لاءِ پهريان لازمي آهي ته ان جي بنيادي نشانين کي سڃاڻي ڌار ڪجي. هن قسم جو ڪم اڻ ـ ڀچيل لپين جي حوالي کان خاص طور تي مشڪل هوندو آهي جيئن سنڌو لکت پڻ ان جو هڪڙو مثال آهي ڇاڪاڻ جو اُتي نشانين جي وڏي پئماني تي هيٺ مٿي هئڻ سبب انهن جي ان حوالي کان تشريح ڪرڻ ۾ ڏکيائي پيش اچي ٿي ته آيا ٻه نشانيون جيڪي بظاهر مختلف ڏيکارجن ٿيون اهي خاص طِرز کان ساڳي ئي نشانيءَ جا ملھ مٽيندڙ آهن يا اهي عليحده طور تي ٻه آزاد نشانيون آهن.

    ملھ مٽيندڙ نشانين جي شمارياتي مقام جي متعلق ڪنهن لکت جي معلوم ڪيل جسد جي چڪاس کان پوءِ (اگر. 1977)، مهاديو 417 آزاد نشانين جي فهرست جي ترتيب تائين پهتو. (13). (پارپولا ساڳيا ئي طريقا ڪتب آڻيندي 386 عددن واري ٿورڙي مختصر فهرست جوڙي ورتي (14). اسان 417 نشانين واري هن فهرست کي پنهنجي مطالعي جي بنياد طور ڪتب آندو آهي. 1c واري تصوير هنن نشانين جي ننڍن جوڙن کي ڏيکاري ٿي. ڪجھ اعتراضن کي پاسيرو رکندي ( ڏسو13 واري حوالي ۾ ڏنل صفحو 14)، لکت جو رُخ عام طور تي غالباََ ساڄي کان کاٻي پاسي ڏانهن تسليم ڪيو ويو آهي ( مهرن ۾ کاٻي کان ساڄي پاسي ۽ نقشن ۾ ساڄي کان کاٻي پاسي ڏانهن). هن مفروضي کي هٿي ڏيندڙ خارجي ۽ داخلي قائل ڪندڙ ثبوت موجود آهي ( مثال طور ڏسو حوالا 4، 13 ۽ 14). نتيجتاََ اسان سنڌو لکت جي متن جي ترتيبوار جوڙجڪ کي ساڄي کان کاٻي پاسي پڙهڻ واري بنياد تي معلوم ڪيو، جيتوڻيڪ مارڪوفي ماڊل برابر طور تي مخالف رخ ۾ پڙهڻ جي قابل پڻ ٿي سگهي ٿو.

    نتيجا:

    سنڌو لکت جو مارڪوفي ماڊل:

    مارڪوفي ماڊل وارو ڄاڻُو سنڌو لکت ۾ ڪيتريون ئي دلچسپ بصيرتون مهيا ڪري ٿو.

    پهريان،( P(si) وارين آڳاٽن امڪانن جي چڪاس مان ان جي باري ۾ معلومات ملي ٿي ته ڪا مخصوص نشاني si ڪهڙي نموني سان ڪنهن متن جو آغاز ڪري ٿي. 2B واري تصوير اڪثر طور تي واقع ٿيل 10 ڏهن نشانين جو (2A) واري تصوير ۾ سنڌو لکت جي جسد اندر امڪان ڏيکاري ٿي.

    2B واري تصوير جي جائزي مان معلوم ٿئي ٿو ته ڪي بار بار ايندڙ نشانيون جهڙوڪ ۽ (2B واري تصوير ۾ ڏنل 3 ۽ 10 عدد وارين نشانيون) ٻين نشانين جي بنسبت ڪنهن متن کي شروع ڪرڻ جو وڌيڪ امڪان رکن ٿيون. ٻئي پاسي، ڪجھ نشانيون جهڙوڪ... ۽ ….( جسد ۾ ڪافي دُهرايل نشاني) وڏي پئماني تي ڪنهن متن کي شروع ڪرڻ جو ڪو امڪان نه ٿيون رکن ( دراصل اهي ڪنهن متن کي بند ڪرڻ جو وڏي پئماني تي امڪان رکن ٿيون، ڏسو 3C واري تصوير ۽ 1 ٽيبل کي). هن قسم جا مشاهدا ٻين طرفان پڻ ماڻيا ويا آهن (13 ـ 16).( P(si جي معلوم ڪيل قدرن منجهان، ڪنهن متن کي شروع ڪندڙ 10 امڪاني نشانين کي معلوم ڪري سگهجي ٿو ( انهن نشانين منجهان جيڪي ويھ 20 ڀيرا ڊيٽاسيٽ dataset ۾ اچن ٿيون) ( ڏسو 3A واري تصوير کي). انهن نتيجن مان معلوم ٿئي ٿو ته اهي نشانيون جيڪي هڪٻئي جهڙيون آهن جهڙوڪ ……. ۽ …...جيڪي لپيءَ جي اندر مختلف واهپن جي ڪتب اچن ٿيون ان ڪري انهن کي ساڳي ئي نشانيءَ جو ملھ مٽيندڙ چئي نه ٿو سگهجي.

    نقل مڪاني وارن امڪانن جو ميٽرڪس جيڪو ( P (si s جي اعدادوشمار مان معلوم ڪيو ويو اهو 2C واري تصوير ۾ ڏيکاريو ويو آهي. سنڌو لکت جي جوڙن جي معلوم ڪيل نقل مڪانين کي ان حوالي کان اهميت جوڳو چئي سگهجي ٿو ڇاڪاڻ جوآزاديءَ خاطر خالي مفروضي کي نظرانداز ڪري سگهجي ٿو ( تفصيل لاءِ ڏسو حوالو 10). نقل مڪاني واري امڪاني ميٽرڪس کي بيان ڪرڻ لاءِ وڏي قدر واري اندراج تي غور وفڪر ڪيو (جيڪو 2C واري تصوير ۾ سفيد رنگ وارو آهي). هي قدر (0.8) P(si 2sj 3) واري امڪان سان ميل جول رکي ٿو ۽ ان ڳالھ جي نشاندهي ڪري ٿو ته نشانيءَ جي پويان ڪا وڏي امڪان واري نشاني ڏنل آهي. ٻيا وڏي امڪان وارا جوڙا ۽ نشانين جا ڊگها سلسلا 3B واري تصوير ۾ ڏيکاريا ويا آهن.

    نقل مڪاني ڪرڻ واري ميٽرڪس مان هي پڻ معلوم ٿئي ٿو ته ڪهڙيون نشانيون امڪاني طور تي ڪنهن متن جي پڄاڻيءَ جو تعين ڪن ٿيون ( هي اهي نشانيون آهن جيڪي EOT جي علامت جي پٺيان اچڻ جو وڏو امڪان رکن ٿيون ( ڏسو 3C ) ( مٿين قطار) ۾ 10نشانيون نظر اچن ٿيون جيڪي ڊيٽاسيٽ ۾ 20 ڀيرا اچن ٿيون، جيڪي (0.87–0.39 جي سلسلي ۾ ) ڪنهن متن جي خاتمي واسطي وڏو امڪان رکن ٿيون. 3C واري ( هيٺين قطار ۾) اڪثر طور تي ايندڙ 10 نشانيون ( جيڪي ڊيٽاسيٽ ۾ گهٽ ۾ گھٽ 20 ڀيرا اچن ٿيون ) اهي ڪنهن متن جي خاتمي ڪرڻ لاءِ گهٽ امڪان رکن ٿيون. نقل مڪاني ڪندڙ ميٽرڪس جو قطر جيڪو ( P(si si جي نمائندگي ڪري ٿو اهو اسان کي ٻڌائي ٿو ته دستياب ٿيل نشاني ڪهڙيءَ طرح پنهنجي پٺيان پاڻ اچي ٿي ( يعني پنهنجو پاڻ کي دهرائي ٿي) . 3D واري شڪل اهڙيون 10 نشانيون ڏئي ٿي جيڪي پنهنجو پاڻ کي دهرائڻ جو ڪافي امڪان رکن ٿيون. هڪڙِي لکت ۾ نشاني صرف هڪڙي جوڙي جي صورت ۾ اچي ٿي اٺن 8 لکتن ۾ اها 6 ڀيرا هڪڙي جوڙي ۾ واقع آهي. ڪافي دلچسپ ڳالھ آهي ته اڪثر ڀيرا ايندڙ نشاني 58 لکتن ۾ 33 جوڙن ۾ واقع آهي. سنڌو لکت ۾ ورجاءُ ڪندڙ اهڙين نشانين جي موجودگي انهن جي لساني تعبير تي دٻاءُ ڏئي ٿي ڇاڪاڻ جو اها تعبير جيستائين نه دهرائبي تيستائين اها سمجھ ۾ نه ايندي.

    2C واري شڪل ۾ نقل مڪاني ڪرڻ واري ميٽرڪس جي اندر موجود تاريڪ حصا نقل مڪاني ڪندڙ اهڙي امڪان جي نشاندهي ڪن ٿا جيڪي ٻُڙيءَ جي ويجهو آهن. نقل مڪاني ڪندڙ ميٽرڪس جي جائزي مان نظر اچي ٿو ته مليل نشانين جي حوالي کان اُتي ڪنهن وڏي سيٽ جي ماتحت مرتب ڪيل نشانين جو ڪو مخصوص سيٽ وجود رکي ٿو جيڪو ان نشانيءَ جي پويان اچڻ جو ڪافي امڪان رکي ٿو، ميٽرڪس جي بقايا نقل مڪاني جو اندراج ٻڙيءَ جي برابر بيهي ٿو. انهي مان معلوم ٿئي ٿو ته سنڌو لکت جو متن لچڪدار ۽ غير لچڪدار علامتن جي سلسلي درميان درمياني درجي واري نرمي جو مظاهرو ڪري ٿو يعني ٻي نشاني ڪهڙي ٿي سگهي ٿي ان جي (تمام ٿورڙي ) لچڪ جو ڪجھ مقدار موصول ٿئي ٿو. اڪثر فطرتي ڀاشائن ۾ پڻ هن طرح جي ڌاڳن (Strings) جي درمياني لچڪ جو مظاهرو نظر اچي ٿو. بيقائدگي (entropy) واري پئماني جي استعمال وسيلي هن لچڪ جو تعين ڪرڻ لاءِ سنڌو لکت جو ٻين لساني ۽ غير لساني سرشتن سان موازنو ڪيو ويو جيڪو 17 واري حوالي ۾ ڏيکاريو ويو آهي (18 هون حوالو پڻ ڏسو).

    نقل مڪاني ڪرڻ واري ميٽرڪس ۾ موجود هڪڙي طريقي جنهن ۾ اهڙي قسم جي جوڙجڪ اڀري سگهي ٿي اها وياڪرڻ جي اصولن جهڙي آهي جيڪا ڪنهن وڏي سيٽ جي ماتحت نشانين کي ڪنهن به مليل نشانيءَ جي پويان اچڻ جي اجازت ڏئي ٿي. ان قسم جي قائدن جي موجودگي ان امڪان کي تقويت بخشي ٿي ته سنڌو لکت ۾ لساني معلومات مذهبي ۽ سياسي نشانين جيان علامتون هڪٻئي سان غير لچڪدار يا ٺوس طريقي سان مليل هئڻ جي بجاءِ ڪنهن خفيه ڪوڊ جي صورت ۾ ڏنل آهن.

    1 واري ٽيبل ان مفروضي جي حمايت ۾ اضافو ڪري ٿي ته سنڌو لکت جي نشانين جي ترتيب پنهنجي متن ۾ ڪنهن قائدي جي ماتحت ٿي سگهي ٿي. 1 ٽيبل ۾ ڏيکارجي ٿو ته ڊيٽاسيٽ ۾ اڪثر طور تي اچڻ وارين ڏهن 10 نشانين مان نشانين جي فقط چند جوڙن جو مليل نشانين جي پويان اچڻ يا وري ان مليل نشانيءَ جو انهن جوڙن جي پويان اچڻ جو ڪافي امڪان نظر اچي ٿو. وياڪرڻ جي اصولن جي امڪان کي هن مشاهدي مان اڃا وڌيڪ تقويت ملي ٿي ته انهن وڏن امڪانن وارين نشانين جا جوڙا تصويري ڏيک سان هڪجهڙائي رکن ٿا. مثال طور، نشانين جو اهو گروه جيڪو………. نشاني جي پويان اچڻ جو وڏو امڪان رکي ٿو اهي نشانيون هي آهن ………………...۽ ………...ساڳي ئي نموني ۽ …………………………..اهڙي قسم جا ٻيا مثال 1 عدد واري ٽيبل ۾ ڏسي سگهجن ٿا ۽ نقل مڪاني ڪرڻ واري ميٽرڪس ۾ پڻ جيڪي سنڌو لکت جي جوڙجڪ ۾ سمايل نحوي قائدن جي يڪسانيت جو واضع اشارو ڪن ٿا.

    عالماڻي ماڊل مان سنڌو متنن جي نون نمونن جو گَرڀجڻ: سنڌو لکتن مان سکيا حاصل ڪندڙ مارڪوفي ماڊل ”اُپائيندڙ / پيداواري“ ماڊل وانگي سرگرمي ڏيکاري ٿو، اهڙي نموني ان مان ڪو به نمونو (Sample) ۽ نشانين جون نيون ترتيبون حاصل ڪري سگهي ٿو جيڪي اصلي لکتن جي شمارياتي ترتيب سان مشابهت رکن ٿا ( البت اهي جوڙيوال شماريات تائين محدود هجن ٿا). 4A واري شڪل سکيا واري ماڊل جي سيمپلنگ (sampling) مان نئين متن کي حاصل ڪرڻ ساڻ گڏوگڏ اصلي جسد سان قريبي ويجهڙائي جو مثال پيش ڪري ٿي. قريبي هڪجهڙائي کي ‘”string edit distance“ وسيلي ڳڻيو ويو جيڪو واڌارن (additions) ڊاه ڊُوه / ڪَٽن سٽن (deletions) ۽ هڪ اسٽرنگ کان ٻئي اسٽرنگ ڏانهن وڃڻ لاءِ گهربل ادل بدل جي تعداد کي ماپيندو آهي. 4A واري شڪل ۾ پيدا ڪيل متن سنڌو متن جي هوبهو ناهي البت اهو ان کان ٻن دلچسپ طريقن ۾ مختلف آهي. پهريون، هيءَ علامت ………..هن علامت………..جي بجاءِ شروعاتي علامت طور تي اچي ٿي. نقل مڪاني ڪندڙ ميٽرڪس جي جائزي مان معلوم ٿئي ٿو ته هنن ٻن نشانين………..۽ …………. هن نشاني…………... جي پويان اچڻ جو وڏو امڪان رکن ٿيون. ٻيو، نموني (sample) وارو متن هن نشاني ……………...بجاءِ ساڳي ئي صورت ۾ هي نشاني ……………….سمائي ٿو. جيڪڏهن اهو فرض ڪجي ته اهي ساڳي ئي سياق و سباق ۾ واقع آهن ته پوءِ ان مان معلوم ٿئي ٿو ته هنن ٻن نشانين يعني…………..۽ …………...جو ساڳيو ئي ڪارآمدي ڪردار آهي. 4B واري شڪل جي (مٿين قطار) نئين پيدا ٿيل سنڌو متن ۽ ٻيوسنڌو لکتن جي ڊيٽاسيٽ سان نزديڪي ويجهڙائي رکندڙ متنن جو هڪڙو ٻيو مثال پيش ڪري ٿي. هڪ دفعو ٻيهر، ان جي اُنهن ۽ ٻين متنن جي مٽا سٽا جي معياري بنياد تي هي اخذ ڪري سگهجي ٿو ته هي نشانيون….. يعني …………...۽ ………….۽ ………...انهن جي متن ۾ ظاهر ٿيڻ جي رُو کان اهي ساڳيون ئي ڪارآمدي خاصيتون رکن ٿيون.

    اڻپورين سنڌو لکتن کي پُر ڪرڻ:

    سنڌو سڀيتا جي مختلف ماڳن جي کوٽائي مان هٿ آيل ڪيترا ئي وکر جن تي اهي نقش اڪريل آهن ڀڳل ٽٽل حالت ۾ آهن، جنهن جي نتيجي ۾ انهن نقشن ۾ ڪافي نشانيون يا ته گم ٿي ويون آهن يا وري پڙهڻ ۾ نه ٿيون اچن. هن ڳالھ جي آزمودي لاءِ ته مڪمل متن جي سکيا رکندڙ ماڊل ڪٿي اڻپورين گم ٿيل / عبارتن کي پُر ڪري سگهي ٿو يا نه، ان لاءِ اسان پهريان سنڌو لکت مان ان جي مڪمل عبارتن جي ڊيٽا سيٽ کي مدِ نظر رکندي ۽ ڪجھ نشانين کي مِٽائيندي ضايع ٿيل نقشن جو مصنوعي ڊيٽاسيٽ تيار ڪيوسين . 4C واري شڪل (مٿين قطار) اهڙي نقش جو هڪڙو مثال پيش ڪري ٿي (مٿين قطار) ۾ مارڪوفي ماڊل پاران MPE جي طريقيڪار جي استعمال تحت مڪمل ڪيل نقش سنڌو لکت جي نقش (هيٺين قطار) سان ميل جول پئي رکيو. عَبر التصديق (cross validation) جي پُر ڪندڙ ادائگي واري مفصل مطالعي مان ظاهر ٿيو ته پهرين درجي وارو مارڪوفي ماڊل % 74 سيڪڙو ميساريل نشانين جي درست طريقي سان اڳڪٿي ڪري سگهي ٿو (10)، جيڪو ڪافي حوصلو بخشيندڙ آهي اڃا فقط جوڙيوار شماريات جي سکيا ورتي ويئي آهي. ڪارڪردگيءَ جي وڌيڪ سُڌاري مان اعليٰ درجي وارن نمونن جي اميد ڪري سگهجي ٿي. 4D واري شڪل ( مٿين قطار) گم ٿيل نشانين ساڻ سنڌو لکت جو هڪڙو متن ڏيکاري ٿي ( 14هين حوالي کان). وچين قطار (MPE) ايم پي اِي واري طريقيڪار مطابق پيدا ڪيل مڪمل متن جو هيٺ ڏنل سنڌو متن سان نزديڪي ويجهڙائي رکندڙ ڏيکاءُ پيش ڪري ٿي. نزديڪي ويجهڙائي رکندڙ متن ٻن حوالن کان پيدا ڪيل متن کان تفاوت رکي ٿو: ”ملھ مٽيندڙ“ ………...کي شامل ڪيو ويو ۽ نشاني………... کي ظاهريءَ طور تي هڪجهڙي نشاني………….. سان هٽايو ويو. 4E واري شڪل جي کاٻي پاسي کان ڏيکاريل متن گم ٿيل نشانين جي اڄاتل تعداد وارو سنڌو لکت جو هڪڙو ٻيو اصلي نقش آهي (13 جي حوالي کان). ساڄي پاسي کان ڏيکاريل ٽي متن MPE جا ماحاصل ( outputs) آهن، جيڪڏهن فرض ڪجي ته 1، 2، ۽ 3 گم ٿيل نشانيون آهن. پهريون ۽ ٻيو MPE وارو متن دراصل سنڌو لکت جي جسد ۾ واقع آهي، جڏهن ته درمياني متن ۾ بعض اوقات ايندڙ جوڙو سمايل آهي. ضايع ٿيل متن جي پُر ڪرڻ جا وڌيڪ مثال سهائتا واري (SI) معلومات ۾ ڏنل آهن (ٽيبل S1).

    سنڌو لکت جي نقشن جي امڪانن جي آزمائش: سکيا ورتل مارڪوفي ماڊل جي حوالي کان سنڌو لکت جي نشانين جي مخصوص ترتيب جو امڪان ٻڌائي ٿو ته ڪنهن نشانيءَ جي ترتيب مارڪوفي ماڊل پاران ان فرضي ڀاشا جي ڪيل ضابطيڪاري سان ڪهڙي نموني جُڙيل آهي. سنڌو لکت جي هڪڙي موجوده متن ۾ نشانين جي ترتيب جي ڦيرگهير ڪندي اسان کي ناٽڪِي نموني متن ۾ ايندڙ گهٽتائي نظر آئي (شڪل SI ۽ متن SI)، جيڪو ان مفروضي کي هٿي ڏياري ٿو ته سنڌو لکت جو متن اهڙن مخصوص لساني قائدن جي ماتحت آهي جيڪي نشانين جي ترتيب جو تعين ڪن ٿا. هن طرح جي چڪاس جو سنڌو لکت جي ان متن سان اطلاق ڪندي جيڪو سنڌو ماٿُر کان ٻاهر جهڙوڪ، ميسوپوٽاميا ۽ اولھ ايشيا جي ٻين ماڳن تان لڌو ويو، اسان کي ڏسجڻ ۾ آيو ته سنڌو ماٿُر مان مليل انهن نقشن منجهان ڪافي نقش پنهنجي هم مرتبي وارن نقشن سان وڏي پئماني تي ڪمتر مُوازنو رکن ٿا. تحقيق، اولھ ايشيا جي متن جو منجهالِي قدر (منجهالِي تهذيب (Median Civilization) هي آهي 1.12 107 جيڪو سنڌو ماٿُر جي اصل بي ترتيب سئو 100 جوڙن واري متن کان حاصل ڪيو ويو ۽ اهي سکيا واري جوڙي مان موازني جي مقصد خاطر خارج ڪيا ويا هئا.

    انهن کوجنائن مان هن دلچسپ امڪان جو پتو پوي ٿو ته ٿي سگهي ٿو ته سنڌو لپي ڪنهن جداگانه ٻوليءَ يا موضوع جي نمائندگيءَ لاءِ سنڌو سڀيتا جي واپارين پاران ڪتب آندي ويندي هئي جيڪي اولھ ايشيا ۾ ڪاروبار ڪندا هئا يا انهن واپارين پاران جيڪي مال کي سنڏو ماٿُر ڏانهن واپس اُماڻيندا هئا. هن قسم جي امڪان جي نشاندهي پهريان پارپولا پاران ڪئي ويئي هئي، جنهن ڏٺو ته اولھ ايشيائي متَنَ ۾ اڪثر طور تي غيرمعمولي نشان جو سنجوڳ سمايل هجي ٿو (14). هن امڪان واسطي اسان جا نتيجا مقداري بنياد فراهم ڪن ٿا. ڪمتر امڪان هن حقيقت مان اڀرن ٿا ڇاڪاڻ جو ٻين ٽيبل ۾ اولھ ايشيائي مَتنَ هن قسم جي ميلاپ / سنجوڳ تي مشتمل آهن يعني………………..۽…………..جيڪو سنڌو سڀيتا مان مليل ڪنهن به متن ۾ نظر نه ٿو اچي، ايتري تائين جو سنڌو ماٿُر جي متَنَ جي ٻين ميلاپن ۾ نشانيون اڪثر طور تي پنهنجي سِر واقع ٿين ٿيون.

    بحث مباحثو: سنڌو لکت جي ترتيبوار بناوت بابت ڪيترن ئي محققن مشاهدا ماڻيا آهن، انهن بعض اوقات ايندڙٻِيڻن، ٽِيڻن، جوڙن ۽ نشانين جي ٻين گروهن تي پنهنجو ڌيان مرڪوز ڪيو آهي (13–15, 20). ڪوسڪينائمِي (Koskenniemi) نشانين جي جوڙيوار تعداد جي استعمال وسيلي نحوي وڻ جوڙي ڪَٽيل حصي جي اڏاوت جي تجويز ڏئي ٿو، جنهن جو مقصد بلآخر ڪنهن رسمي وياڪرڻ جي اخذ ڪرڻ وارو هئڻ گهرجي (20).

    بعض اوقات ايندڙ ٻِٽن، ٽيِڻن ۽ چئُوڻن جوڙن تي مشتمل واضع ڪٽوتي واري متن جي بنياد تي ڪافي ويجهڙائي ۾ يادئو، واهيا ۽ سندس ساٿين (15، 16) سنڌومتن جي شمارياتي چڪاس ورتي آهي. هن ڪالم ۾ اسان مارڪوفي ماڊل جي بنياد تي سنڌو لکت ۾ موجود ترتيبوار جوڙجڪ دستياب ڪيون ٿا. نقل مڪاني ڪندڙ ميٽرڪس جيڪو سنڌو متن جي جسد مان معلوم ڪيو ويو ان جي چڪاس منجهان ان حوالي کان خاص معلومات حاصل ٿي ته ڪهڙي نشاني مخصوص نشانيءَ جي پويان اچڻ جو رجحان رکي ٿي ۽ ڪهڙي پويان نه اچڻ جو رجحان رکي ٿي. نقل مڪاني ڪندڙ ميٽرڪس سنڌو لکت جي متن مان نشانين جي عام سلسلن ۽ انهن جي بعد وارن سلسلن کي ڇِڪي ٻاهر ڪرڻ جو امڪاني بنياد پڻ فراهم ڪيو. اسان اها تصديق پيش ڪئي سين ته سکيا ورتل مارڪوفي ماڊل ڪهڙي نموني متن جي نمونن جي پيداوار لاءِ ڪتب آڻي سگهجي ٿو، جنهن سان نشانين جا گروه ظاهر ٿين ٿا جيڪي ڪنهن متن ۾ ساڳي ئي نموني متحرڪ هئڻ جو رجحان رکن ٿا. هن قسم جي حڪمت عملي کي مڪمل نقشن جي جسد جي بنياد تي سنڌو لکت جي اڻپورين ۽ ناقابلِ فهم، گم ٿي ويل حصن کي ڀرڻ واسطي پڻ ڪتب آڻي سگهجي ٿو.

    آخر ۾، اولھ ايشيا جي ماڳن تان دريافت ڪيل سنڌو لکت جي نقشن جي هڪجهڙائي جي سنڌو سڀيتا جي لکتن سان موازني مان اها نشاندهي ملي ته اولھ ايشيا جا ڪيترائي نقش سنڌو سڀيتا جي نقشن کان مختلف قسم جي موضوعاتي مواد جي نمائندگي ڪري سگهن ٿا. اسان جا نتيجا بظاهران مفروضي کي هٿي ڏين ٿا ته سنڌو لکت ڪنهن لسانياتي لکتي سرشتي جي نمائدگي ڪري ٿي. اسان جي نشانين جي سلسلن واري مارڪوفي چڪاس جيتوڻيڪ جوڙيوار شماريات تائين محدود آهي، پوءِ به اها ان ڳالھ کي واضع ڪري ٿي ته نقشن اندر نشانيون ڪنهن بي اصول طريقي ۾ واقع نه آهن پر اهي ڪنهن قائدي جي پيروي ڪندي نظراچن ٿيون. (1) ڪجھ نشانيون نقشن جي اڳيان اچڻ جو اعليٰ امڪان رکن ٿيون جڏهن ته انهن مان ڪجھ ٻيون زري گهٽ ڪنهن به وقت منڍ ۾ واقع نه ٿيون ٿين، ۽ (2) ڪنهن مخصوص نشانيءَ واسطي، ڪجھ اهڙيون نشانيون آهن جيڪي ان نشانيءَ جي پويان اچڻ جو وڏو امڪان رکن ٿيون ۽ ٻيون نشانيون جن جو ان نشاني پويان اچڻ جو غير اهم امڪان آهي. وڌيڪ اهو ته، لڳي ٿو ته نشانيون سنڌو لکت جي متن ۾ پنهنجي حالت موافق ڪارآمدي درجن ۾ اچن ٿيون، جنهن تحت ڪا مخصوص نشاني ان جي برابر درجي ۾ ڪنهن ٻي نشاني وسيلي هٽائي سگهجي ٿي. جملي جي اهڙي نموني واري نحوي ساخت واري جوڙجڪ جو ڪنهن غيرلساني سرشتي سان مفاهمت ڪرڻ مشڪل عمل آهي. اضافي طور، هي لپي ايتريقدر وسيع رهي آهي جو اها مختلف قسم جي موضوعاتي موادن جي نمائندگي ڪري سگهي ٿي اسان جي هي کوج ان داعويٰ جي خلاف کليل دليل آهي ته اها لپي صرف مذهبي توڻي سياسي علامتن جي نمائندگي ڪري ٿي. سنڌو لکت جي لسانيات جي حمايت ۾ وڌيڪ دليل پارپولا پاران پيش ڪيا ويا آهن (21).

    اسان جو مطالعو ڪجھ ڪوتاهين کان متاثر ٿيو آهي جن کي ايندڙ ڪم ۾ سلجهايو ويندو. پهريون، اسان جو پهرين ـ درجي وارو مارڪوفي ماڊل نشانين درميان فقط انهن تابعدارين کي جهلي وٺي ٿو جيڪي جوڙِيوار آهن، اهو وڏي ـ سلسلي وارن تابعدارين کي نظرانداز ڪري ٿو. اهڙي قسم جي تابعدارين کي وڏي درجي وارا مارڪوفي ماڊل (10) ۽ ٻيا گرافيائي امڪانن وارا ماڊل (6) وڌيڪ درست طريقي سان نموني سازي ڪندا. ٻِي ممڪنه ڪوتاهي اسان پاران 1977 ع واري سنڌو متن جي جسد جي واهپي جي ڪارڻ آهي (13). تنهان پوءِ نوان متن ۽ نشانيون دريافت ڪيون ويو آهن، ۽ 650 جي لڳ ڀڳ نشانين جي فهرست تجويز ڪئي ويئي آهي (22). جيتوڻيڪ، نئين لڌل سامان جو قسم 1977 ع واري جسد ۾ ڏنل متن جي درجن جهڙو ئي آهي يعني اهي به مهرون ۽ تختيون وغيره آهن. جيڪي اسان جي ڪالم ۾ چڪاسيل ساڳي ئي لساني جوڙجڪ جو مظاهرو ڪن ٿيون. جيڪي نيون نشانيون لڌيون ويون آهن، اهي عام طور تي دستياب ٿيل 1977 ع واري جسد جي نشانين کان تعداد ۾ وڌيڪ آهن، جن ۾ پهريان کان دريافت ڪيل نشانيون پڻ شامل آهن. ان ڪري، اسان اميد ڪيون ٿا ته نئين مواد جي سبب نشانين جي تعداد ۾ ٿورڙي تبديلي رونما ٿيندي ۽ مارڪوفي ماڊل ۾ پڻ ٿورڙن مشروط امڪانن جي تبديلي جنم وٺندي. ان جي باوجود به، سمورين ڄاتل سڃاتل متنن ۽ نين نشانين جي فهرست مستقبل لاءِ مکيه مقصد رهي ٿو. اضافي طور، اسان جي چڪاس ۾ مختلف جغرافيائي مقامن جي مشترڪه ڄاڻ کي شامل ڪيو ويو. اڃا وڌيڪ ڀانت ڀانت وارن ماڳن جي چڪاس ان دلچسپ سوال تي روشني وجهندي ته مختلف خِطن جي نشانين جي سلسلاتي نمونن ۾ فرق آهي يا نه.

    خُلاصي طور، اسان جيڪي نتيجا پيش ڪيا آهن اهي مضبوطيءَ سان ان امر جي نشاندهي ڪن ٿا ته ڪي مخصوص قائدا وجود رکن ٿا جيڪي سنڌو لکت جي نشانين جي تسلسل کي اهڙي نموني هلائي رهيا آهن جنهن مان اهي ان جي اندر موجود وياڪرڻ جي نشاندهي ڪن ٿا. سنڌو لکت جي نقشن جي دستياب جسد منجهان وياڪرڻ جو سڌي سنئين نموني نتيجو ڪڍڻ لاءِ مستقبل واسطي هڪڙي ڀيانڪ پر قابلِ عُبور للڪار (جيڪا 14، 15 ۽ 20 واري حوالي سان پڻ جڙيل آهي) اها شمارياتي ۽ ڪِلي (مشيني) سکيا واري طريقيڪار ( Technique) کي اپنائڻ واري آهي.

    طريقا: اسان پنهنجي مارڪوفي ماڊل واري چڪاسيندڙ طريقيڪار کي سنڌو متن جي هڪڙي وڏي سيٽ جي ماتحت حصي تي لاڳو ڪيو سين جيڪو 1977 ع ۾ مهاديون واري فهرست مان اخذ ڪيو ويو (13). هي ڊيٽاسيٽ جنهن کي (EBUDS) جي نالي سان ڄاتو وڃي ٿو، مهاديون جي فهرست منجهان ان سموري متن کي خارج ڪري ٿو جنهن ۾ مبهم يا گم ٿيل نشانيون موجود آهن ۽ اهو سمورو متن پڻ جنهن ۾ ڪنهن شيءِ جي مٿان هڪڙي ئي پاسي کان ڪيتريون ئي لڪيرون ڏنل آهن. ڪنهن متن جي نقلن هئڻ (duplicates) واري صورت ۾ ڊيٽا سيت ۾ ان جي فقط هڪڙي ڪاپي رکي ويئي آهي. جنهن جي نتيجي ۾ 1,548 تعداد وارين لڪيرن ۽ 7،00 نشانين تي مشتمل ڊيٽاسيٽ وجود ۾ آيو. اسان مهاديون جي 417 نشانين واري فهرست اِضافي EOT نشاني طور تي ڪتب آنديسين ته جيئن هر هڪ متن جي پڇاڙي جي نشاندهي ڪري سگهجي. ماڊل ۾ نشانيون ساڄي کان کاٻي پاسي ڏانهن متن جي هر هڪ ِسٽَ ۾ داخل ڪيون ويون، جنهن جي پڄاڻي EOT واري نشانيءَ سان ڪئي ويئي.

    مارڪوفي ماڊل وسيلي اعداد وشمار (Data) جي سکيا: مارڪوفي ماڊل جي متعين مقدار ۾ پهريان وارا امڪان (P(si ۽ نقل مڪاني ڪندڙ امڪان (P(si sj شامل آهن. انهن امڪانن جي ڳڻپ جو سادو طريقو تڪراري تعداد جي ڳڻپ سان لاڳاپيل آهي يعني ( اP(siاهڙو سيٽ آهي جيڪو si واري نشاني جي ڪنهن متن جي اڳيان اچڻ وارن ڀيرن جي عدد جي برابر آهي جنهن کي متنن جي مجموعي تعداد سان ونڊيو ويندو. هن کي وڌ ۾ وڌ متعين ڪيل امڪان جي تخميني جي برابر پيش ڪري سگهجي ٿو (9). جيتوڻيڪ، ان قسم جو تخمينو، خاص طور تي نقل مڪاني ڪندڙ P(si sj واري امڪان جي حوالي کان ڊيٽاسيٽ جي ننڍڙي هئڻ جي صورت ۾ قليل قسم جا تخمينا ڏئي سگهي ٿو، جيئن سنڌو لکت جي حوالي کان نظر اچي ٿو، ڇاڪاڻ جو نشانين جا ڪيترائي جوڙا ننڍڙي ڊيٽا سيٽ ۾ هرگز به واقع ٿي نه ٿا سگهن، جيتوڻيڪ، انهن جا حقيقي امڪان ٻُڙيءَ جي برابر به ڪو نه هوندا.

    ”هموار“ طريقيڪار تي وڏي پئماني تي تحقيق ڪئي ويئي آهي، جيڪا مختلف انڪشافي اصولن جي بنياد تي اڻ ڏٺل ننڍڙن امڪانن جي مقرري تي مشتمل آهي ( ڏسو باب 6، هڪڙي جائزي واري 9 حوالي ۾ ). هن ڪالم جي نتيجن خاطر ترميم شده ڪنيسر ـ ني واري هموار طريقيڪار( modified Kneser–Ney smoothing technique) کي ڪتب آندوسين (23، 24 حوالي جي بنياد تي). هي اهڙو طريقيڪار آهي جيڪو ڊيٽاسيٽ جي ڪيترن ئي معيارن تي ٻين هموار طريقيڪارن جي بهتر ڪارڪردگي واسطي ڏيکاريو ويو آهي (23).

    خالي نشانين کي پُر ڪرڻ : جيڪڏهن x= x1x2…xL ڪنهن ڊيگھ L جو اسٽرنگ آهي جتي xi هر هڪ بي اصول ملھ مٽيندڙ آهي جنهن جو ملھ فهرست ۾ موجود ڪابه نشاني ٿي سگهي ٿي. جيڪڏهن x ڏيکاري ٿو xi کي جنهن جا ملھ مليل آهن ۽ Y ڏيکاري ٿو xi کي جنهن جو ملھ معلوم ناهي. عام گرافيائي ماڊل لاءِ M ،۽ MPE نامعلوم ملھ مٽيندڙ Y لاءِ جيڪڏهن X جو ”ثبوت“ ڏنو وڃي ته ان جي ڳڻپ هيئن بيهندي:

    ( Y* = arg maxY P(YX,M)

    سکيا ورتل مارڪوفي ماڊل واسطي M (, ), where i P(si) and ij P(si sj). . اسان مارڪوفي ماڊل لاءِ هيئن شمار ڪنداسين MPE Y* arg maxY P(YX, , ) اسان وِٽيربِي الگوريٿم ( وٽيربي وارو حساب و شمار) ڪتب آڻينداسين (25) ( الگوريٿم جي تفصيل لاءِ ڏسو حوالو 8 ۽ 12).

    ٿورائتا آهيون: هن ڪم جي واسطي هيٺين ادارن پاران سهائتا ڪئي ويئي:

    پيڪرڊ فائونڊيشن Packard Foundation، سر جمسيٽجي ٽاٽا ٽرسٽ Sir Jamsetji Tata Trust، سمپسن سينٽر فار دي هيومينٽيز ايٽ دي يونيورسٽي آف واشنگٽن (the Simpson Center for the Humanities at the University of Washington (UW، دي يوُ ڊبليو ڪاليج آف آرٽس اينڊ سائنسز (the UW College of Arts and Sciences)، دي يُو ڊبليو ڪاليج آف انجنِيئرنگ اينڊ ڪمپيوٽر سائنس اينڊ انجنيئرنگ ڊپارٽمينٽ (UW College of Engineering and Computer Science and (Engineering Department ۽ انڊس رسرچ سينٽر، چينائي، انڊيا. (the Indus Research Centre, Chennai, India).

    حوالا:

    1. اي. ڪننگهام (1875) 1872ـ 73 ع ۾ پيش ڪيل هندستان جي آثارِ قديمه بابت تحقيقي دستاويز (آرڪالاجيڪل سروي آف انڊيا، ڪلڪته، انڊيا).

    2. ڪِينوئِر جي.ايم (1998) سنڌو سڀيتا جا قديم شهر (آڪسفورڊ يونيورسٽي پريس، آڪسفورڊ، يُو.ڪي).

    3. پاسهل جِي.ايل (2002) سنڌو سڀيتا (اَلتا مِيرا پريس، والنَٽ ڪِرِيڪ، سِي.اي).

    4. پاسهل جِي.ايل (1996) سنڌو سڀيتا جو دورـ لکتي سرشتو (يونيورسٽي آف پينسِلوانيا پريس، فِلاڊيلفِيا).

    5. بِشپ سِي (2008) نمونن جي سڃاڻپ ۽ ڪِلي (مشيني) سکيا (اِسپرِنگر، برلن).

    6. جارڊن ايم.ايل (2004) گِرافيائي ماڊلز. اسٽيٽ ساءِ (بيئِشين (Bayesian) شماريات بابت خاص پرچو) 19:140 –155

    7. مارڪوف AA ه (1906) وڏن عددن جي انحصاري مقدارن واري قائدي جو ڦهلاءُ (روسي ٻوليءَ ۾ لکيل) اِزوو فِز ـ ميتم اوبِچ ڪازان يونيورسٽي ( Izv Fiz-Matem Obsch Kazan Univ) (2nd Ser) 15:135–156

    8. جيلينِڪ ايف (1997) آواز جي سڃاڻپ واسطي شمارياتي طريقا (ايم آئي ٽي پريس، ڪيمبرج،ايم اي).

    9. ميننگ سِي، شُو زِي ايڇ (1998) فطرتي ڀاشائن جي طريقيڪار جا شمارياتي بنياد (ايم آئي ٽي پريس، ڪيمبرج، ايم اي).

    10. يادئو ۽ ٻيا (2009) اين ـ گرامن وسيلي سنڌو لکت جي شمارياتي چڪاس (Arxiv: 0901.3017)

    11. ڊريڪ اي ڊبليو (1967) فنڊامينٽلز آف اپلائيڊ پراببلٽي ٿيوري (مِڪ گرا ـ هِل، نيويارڪ).
     

هن صفحي کي مشهور ڪريو