কন্ঠ নকল করে এআই, আশীর্বাদ না অভিশাপ?
টেকটক বাংলাদেশ ডেস্ক : কৃত্রিম বুদ্ধিমত্তা-বিষয়ক বিশ্বের অন্যতম প্রভাবশালী প্রতিষ্ঠান ওপেনএআই গত ৩০শে মার্চ তাদের টেক্সট-টু-ভয়েস টুল "ভয়েস জেনারেশন"-এর প্রিভিউ রিলিজ করেছে। একজন ব্যক্তির কণ্ঠে যেকোনো ভাষায় বলা কথার মাত্র ১৫ সেকেন্ড রেকর্ডিং এই টুলে ইনপুট দিলে হুবুহু সেই নমুনা স্বরের মতো আউটপুট বেরিয়ে আসবে৷
শুধু তাই নয়, ইনপুট যে ভাষারই হোক, আউটপুটটি ইচ্ছেমতো যেকোনো ভাষায় সেট করার সুবিধাও এ-তে আছে। এ ধরনের টুল ব্যবহারের সাথে জড়িত ঝুঁকির কথা বিবেচনায় নিয়ে চুক্তিবদ্ধ কিছু কোম্পানির বাইরে এখনো কাউকে ভয়েস জেনারেশন ব্যবহারের অ্যাক্সেস দেয়নি ওপেনএআই।
ভয়েস জেনারেশনের পেছনে যে মডেল কাজ করে, সেটির ব্যবহার ওপেনএআই ২০২২ সালের শেষের দিকেই চ্যাটজিপিটির এপিআই ও রিড-অ্যালাউড ফিচারে শুরু করে। তবে সেখানে ব্যবহারকারীর ভয়েস ইনপুট করার সুযোগ ছিল না। পরবর্তীতে এ মডেলটিকে লাইসেন্সকৃত ও ইন্টারনেটের উন্মুক্ত তথ্য দিয়ে ট্রেইন করা হলে ধীরে ধীরে এটি নমুনা ভয়েস অনুকরণ করে অডিও তৈরি করতে সক্ষম হয়।
এ বিষয়ে ওপেনএআইয়ের ব্লগে প্রকাশিত বিবৃতিতে দেখানো হয়েছে, একাধিক নমুনা টেক্সট ও ভয়েস গ্রহণ করে কীভাবে এ মডেল বিভিন্ন ভাষায় টেক্সট পড়ে থাকে৷
বোঝাই যাচ্ছে, এই মডেলের মাধ্যমে চাইলেই একজনের কণ্ঠ নকল করে তার নামে মিথ্যা বক্তব্য ছড়িয়ে অস্থিতিশীল অবস্থা তৈরি করার সুযোগ লুফে নিবে দুষ্কৃতকারীরা৷ গত মাসেই মার্কিন প্রেসিডেন্ট জো বাইডেনের গলার স্বর এভাবে অনুকরণ করে এআই-জেনারেটেড এক ভুয়া ফোনকল যুক্তরাষ্ট্রের অনেক নাগরিককে বিভ্রান্ত করেছে৷
এরকম পরিস্থিতি এড়ানোর জন্যই ভয়েস জেনারেশনের অ্যাক্সেস পাওয়া কোম্পানিগুলো ওপেনএআইয়ের সাথে এই মর্মে চুক্তি করেছে যে, টুলটি ব্যবহার করে অনুমতি ছাড়া কারোর কণ্ঠস্বর তারা অনুকরণ করবে না। এছাড়াও আউটপুট অডিও-ক্লিপগুলো ট্র্যাক করতে এদের সাথে ডিজিটাল ওয়াটারমার্ক যুক্ত করার ব্যবস্থা নেওয়া হয়েছে।
তবে এই এআই টুলের নিয়ন্ত্রিত ব্যবহার যে আশীর্বাদ বয়ে আনবে, সে ব্যাপারে নিশ্চিতভাবেই বলা যায়। ভয়েস জেনারেশনের যেহেতু অনুবাদ করার ক্ষমতা আছে, কাজেই এর সাহায্যে অদূর ভবিষ্যতে যেকোনো ভাষার মানুষ অন্য ভাষার কারোর সঙ্গে তাৎক্ষণিক বা রিয়েল-টাইমে কথা বলতে পারবে। এছাড়াও কন্টেন্ট ও ফিল্ম নির্মাতাদের ভয়েসওভার আর ডাবিংয়ের কাজও বেশ সহজ করবে এটি৷
টুলটির অ্যাক্সেস পাওয়া প্রতিষ্ঠানের মধ্যে আছে শিক্ষা-বিষয়ক প্ল্যাটফর্ম এজ অফ লার্নিং এবং স্বাস্থ্য-বিষয়ক কোম্পানি লাইফস্প্যান ও ডিম্যাগি। কোম্পানিগুলো মডেলটি কীভাবে ব্যবহার করে, বর্তমানে তা পর্যবেক্ষণ করে এর সাথে সম্পর্কিত ঝুঁকিগুলো যাচাই করে নিচ্ছে ওপেনএআই। পর্যবেক্ষণের ফলাফল কেমন হয়, তার উপর নির্ভর করছে ভয়েস জেনারেশন কবে নাগাদ সাধারণের ব্যবহারের জন্য বাজারজাত করা হবে। এখন শুধু সেদিনের অপেক্ষা৷