তথ্যযুদ্ধ ও বাংলা ডেটার দখল : কার হাতে আমাদের ভাষা ও ভবিষ্যৎ

এম এ মুকিত চৌধুরী | সোমবার , ৩০ জুন, ২০২৫ at ৫:৫২ পূর্বাহ্ণ

বাংলাদেশ যখন ডিজিটাল রূপান্তরের জয়গানে আত্মমগ্ন, তখন এক নিরব কিন্তু ভয়ংকর যুদ্ধ শুরু হয়ে গেছে তথ্য যুদ্ধ। এই যুদ্ধে অস্ত্র হলো ডেটা, যুদ্ধক্ষেত্র হলো ক্লাউড সার্ভার এবং শত্রু হলো অদৃশ্য বৈশ্বিক প্ল্যাটফর্ম যারা আমাদের ভাষা, আচরণ, রাজনৈতিক প্রবণতা, ভোক্তা মানসিকতা ও রাষ্ট্রীয় কার্যপ্রবাহ বিশ্লেষণ করে আমাদেরই বিপক্ষে ব্যবহার করছে।

বাংলার ডেটা কে দখল করে আছে? বাংলাদেশের অধিকাংশ ওয়েবসাইট, মোবাইল অ্যাপ্লিকেশন এমনকি সরকারি প্ল্যাটফর্মগুলোর ডেটা হোস্টিং হয় আমেরিকা, ইউরোপ বা ভারতের সার্ভারে। দেশের বৃহত্তম ফিনটেক প্রতিষ্ঠান, ব্যাংক, স্বাস্থ্য অ্যাপ, শিক্ষা প্ল্যাটফর্ম প্রায় সবখানেই বিদেশি ক্লাউড নির্ভরতা প্রকট। এমনকি bKash বা সরকারি কিছু প্ল্যাটফর্মের ডেটা নিয়েও প্রশ্ন রয়েছে, কতটা নিয়ন্ত্রণ বাংলাদেশ সরকারের নিজের হাতে?

সোশ্যাল মিডিয়া, সার্চ ইঞ্জিন, কনটেন্ট প্ল্যাটফর্ম, বিজ্ঞাপন টার্গেটিং সিস্টেম সবখানেই বাংলা ভাষা বিশ্লেষণের কাজ করছে বিদেশি AI মডেল। তারা জানে কোন অঞ্চলের মানুষ কীভাবে কথা বলে, কোন রাজনীতিকের জনপ্রিয়তা বাড়ছে, কার বক্তব্যে রাগ বা হাসির প্রতিক্রিয়া বেশি আসে।

আমরা কি বুঝতে পারছি? বাংলা ভাষার AI ইতিমধ্যেই আমাদের ছাড়া তৈরি হচ্ছে, আমাদেরই ডেটা ব্যবহার করে।

তথ্যের নিয়ন্ত্রণ মানে চিন্তার নিয়ন্ত্রণ: যখন কোন ভাষা বা সংস্কৃতির ডিজিটাল রূপান্তর বিদেশে ঘটে, তখন তাদেরই পছন্দ অনুযায়ী ‘কী দেখানো হবে, কী শোনা যাবে, কোন শব্দ বেশি জরুরি, কোন মত ধামাচাপা পড়বে’ এসব সিদ্ধান্ত নেয় অ্যালগরিদম, আর সেই অ্যালগরিদমগুলো আমাদের তৈরি নয়।

বাংলা ভাষার জন্য GPT বা BERTএর মত বড় AI মডেল বানানো হচ্ছে Google বা Metaএর ল্যাবে। তারা বলছে ‘low-resource language’ বলে বাংলা এখনো পূর্ণাঙ্গ সাপোর্ট পাচ্ছে না। অথচ, বাংলাদেশ থেকেই কোটি কোটি বাংলা শব্দ, বাক্য, ভিডিও ট্রান্সক্রিপ্ট যাচ্ছে তাদের সার্ভারে। আমরা কি শুধু ডেটা শ্রমিক হয়ে থাকব?

রাষ্ট্রীয় নিরাপত্তা ও ভবিষ্যৎ প্রযুক্তি: ডেটা শুধু কাস্টমার ইনফো বা ফেসবুক পোস্ট নয়। রাষ্ট্রীয় বাজেট, স্বাস্থ্য রিপোর্ট, নিরাপত্তা ডকুমেন্ট, গোয়েন্দা বিশ্লেষণ সবই এখন ডিজিটাল। এসব যদি বিদেশি ক্লাউডে থাকে, তাহলে সাইবার হামলা বা তথ্য চুরি রোধ করা কতটা সম্ভব?

আরও চিন্তার বিষয় ভবিষ্যতের যেকোনো উন্নত রাষ্ট্র হবে অওচালিত রাষ্ট্র। যদি বাংলাদেশের অও মডেল বিদেশি ভাষা ও তথ্য নির্ভর হয়, তবে নীতি গ্রহণ, নাগরিক সেবা, ভাষাগত সংরক্ষণ সবকিছুতেই বিদেশি প্রভাব স্পষ্ট হয়ে যাবে। তখন আর স্বচ্ছতা, গণতন্ত্র বা ভাষার অগ্রাধিকার কেবল কাগজে থাকবে।

আমরা কী করছি ?: বাংলাদেশে এখনো নিজস্ব ‘Sovereign AI Infrastructure’ নেই। নেই বাংলা ভাষাভিত্তিক জাতীয় ডেটাসেট, নেই নিরাপদ সরকারি ক্লাউড সার্ভার যেখানে বাংলাভাষার NLP, OCR, Chatbor, Speech-to-Text তৈরি হবে।

সরকারি প্রকল্পে এখনো AWS বা Google Cloud নির্ভরতা দেখা যায়। বিশ্ববিদ্যালয়ের গবেষণা হয় লোকাল ডেটা ছাড়া। ভাষাবিজ্ঞান ও প্রযুক্তির এই বিচ্ছিন্নতা যেন বাংলা ভাষাকেই দ্বিতীয় শ্রেণির নাগরিক বানিয়ে দিচ্ছে ডিজিটাল জগতে।

কী করা প্রয়োজন?: . বাংলাদেশে সরকারনিয়ন্ত্রিত AI Data Center গড়ে তোলা, যা BDIX কানেক্টেড, গোপনীয়তাবান্ধব ও এনক্রিপ্টেড হবে।

. বাংলা ভাষার জন্য LLM (Large Language Model) তৈরি করতে জাতীয় গবেষণা তহবিল চালু করা।

. ডেটা সেভারেইনিটি আইন তৈরি করে বিদেশে ডেটা হোস্টিং নিয়ন্ত্রণ করা।

. সরকার ও বেসরকারি খাতে অও পাইলট প্রকল্প চালু করা, যেমন বাংলা চ্যাটবট, ভয়েস অ্যাসিস্ট্যান্ট, স্বয়ংক্রিয় অনুবাদ।

. দেশের তরুণ AI উদ্ভাবকদের জন্য Bangla AI Hub তৈরি করা যেখানে ওপেন ডেটা, অচও ও মডেল ট্রেইনিংয়ের সুযোগ থাকবে।

জেনারেশন Z: এই যুদ্ধের প্রথম সারির যোদ্ধা: এই যুদ্ধ শুধু নীতিনির্ধারকদের নয়। Gen Z বা তরুণ প্রজন্মকেই হতে হবে ডেটা স্বাধীনতার ফ্রন্টলাইন সৈনিক। যারা TikTok, YouTube, Instagramএ প্রতিনিয়ত কনটেন্ট তৈরি করছে, তারা যেন বুঝে তাদের কনটেন্টের পেছনের ডেটা, তাদের পরিচয়, অভ্যাস, মতামত কোথায় যাচ্ছে, কে ব্যবহার করছে?

তরুণ উদ্যোক্তারা চাইলে এখন থেকেই বাংলাভাষা ভিত্তিক AI স্টার্টআপে বিনিয়োগ করতে পারে। বিশ্ববিদ্যালয় পর্যায়ে ‘AL for Bangla’ ক্লাব, হ্যাকাথন ও ইনোভেশন ল্যাব গড়ে তোলা যেতে পারে।

আমরা চাই Bangla AI Taskforce যেখানে তরুণদের সদস্য করা হবে ডেটা সংগ্রহ, মডেল ট্রেইনিং, ইথিকস মডিউল ও ওপেনসোর্স বাংলা ঘখচ টুলসে অংশগ্রহণ নিশ্চিত করতে হবে। সরকার বা বেসরকারি বিনিয়োগকারীরা চাইলে এবহ ত Gen Z Angel Network চালু করতে পারেন, যেখানে তরুণরা ডেটাস্বাধীনতা ও AI উন্নয়নে সরাসরি অংশ নিতে পারবে বিনিয়োগকারী বা সদস্য হিসেবে।

জনমত গড়ার সময় এখন:এই যুদ্ধ কেবল প্রযুক্তির নয় ভাষা, সংস্কৃতি ও স্বাধীনতার লড়াই। আমাদের পূর্বপুরুষরা বাংলার জন্য জীবন দিয়েছেন, আর আমরা কি আজ সেই ভাষা আর তথ্যের নিয়ন্ত্রণ অন্যের হাতে তুলে দেবো?

এই মুহূর্তে প্রয়োজন ব্যাপক গণসচেতনতা। সংবাদপত্র, সোশ্যাল মিডিয়া, বিশ্ববিদ্যালয় ও সংসদ সবাইকে জানতে হবে, ‘ডেটা যদি নিজের না থাকে, তবে ভাষাও নিজের থাকবে না।’

বাংলাদেশকে যদি সত্যিকার অর্থে ডিজিটাল সোনার বাংলা করতে হয়, তাহলে আগে চাই ডেটা স্বাধীনতা। সেটা না হলে, ভবিষ্যতের অও দিয়ে বাংলাকে চালাবে অন্য কেউ, অন্য উদ্দেশ্যে।

লেখক: প্রাবন্ধিক, কলামিস্ট।

পূর্ববর্তী নিবন্ধদেয়াঙ পরগণার আকবরী মসজিদ : মোগল স্থাপত্যের অনন্য নিদর্শন
পরবর্তী নিবন্ধদূরের দুরবিনে