মাত্র ৩০ থেকে ৪০ বছর আগেও সায়েন্স ফিকশনের বাইরে কৃত্রিম বুদ্ধিমত্তা বা আর্টিফিশিয়াল ইন্টেলিজেন্স (এআই) নিয়ে খুব একটা ভাবা যেত না। সেসময় যন্ত্রকে আরও বুদ্ধিমান করে তোলার চিন্তাভাবনা চলতে থাকলেও, সাধারণ মানুষের কাছে এটি ছিল এক অবাস্তব কল্পনার মতো। অনেকেরই বিশ্বাস ছিল না যে, এআইয়ের এত উন্নতি সম্ভব। বিশ্লেষণ দ্য গার্ডিয়ানের
কিন্তু আজকের যুগে ফেসবুক, ইউটিউবের মতো সামাজিক যোগাযোগ মাধ্যমের রিকমন্ডেশন সিস্টেম, বুদ্ধিমান রোবট কিংবা চ্যাটবট, স্বয়ংক্রিয় গাড়ি, অ্যামাজনের ভার্চুয়াল অ্যাসিস্ট্যান্ট অ্যালেক্সা বা আইফনের সিরি; সবকিছুই এআইয়ের অংশ। ভাবতেই অবাক বনে যেতে হয়- আমরা কত দ্রুত কৃত্রিম বুদ্ধিমত্তার জগতে প্রবেশ করছি।
এআই আমাদের জীবনযাত্রাকে অনেক ক্ষেত্রে ক্রমাগত সহজতর করে তুলছে-এনিয়ে নেই কোনো সন্দেহ। তবে উপকারিতার পাশাপাশি কিছু হুমকিও কি আছে? কিছু কিছু ক্ষেত্রে এআই মানুষকে ছাড়িয়ে গেছে অনেক আগেই। ১৯৯৭ সালে দাবা খেলায় বিশ্ব চ্যাম্পিয়নকে হারিয়ে দিয়ে আইবিএমের ডিপ ব্লু সুপারকম্পিউটার একসময় খুব হইচই ফেলে দিয়েছিল।
মেশিন লার্নিংয়ের কারণে কৃত্রিম বুদ্ধিমত্তাসম্পন্ন যন্ত্র চারপাশের পরিবেশ থেকে স্বয়ংক্রিয়ভাবে শিখতে পারে। ফলে অনেক সময় এ যন্ত্রগুলো আগ্রাসী হয়ে উঠতে পারে।
বিখ্যাত পদার্থবিজ্ঞানী স্টিফেন হকিং কৃত্রিম বুদ্ধিমত্তা নিয়ে বহুদিন আগেই সতর্কবার্তা দিয়ে গেছেন। গত বছর গুগলের সাবেক চেয়ারম্যান এরিক স্মিডের মুখেও শোনা গিয়েছিল সতর্কবাণী।
তিনি বলেছিলেন, ‘কৃত্রিম বুদ্ধিমত্তা মানুষের কাছ থেকে শিখতে পারে। তাহলে ভেবে দেখুন, যদি এটি ভুল কিছু শেখে কিংবা ভুল সুপারিশ করে– তবে যেকোনো কিছু ঘটতে পারে, এমনকি যুদ্ধও লেগে যেতে পারে।’
মানুষের কর্মসংস্থানকেও অনিশ্চয়তায় ফেলছে কৃত্রিম বুদ্ধিমত্তা। ধারণা করা হয়, এটি আরও উন্নত হলে এবং এর ব্যবহারের ব্যাপক প্রসার হলে– অধিকাংশ মানুষের কাজ নিয়ে নেবে বিজ্ঞানের এ আবিষ্কারটি।
সম্প্রতি ‘আর্টিস্ট রিপ্লেসমেন্ট’ বা শিল্পী প্রতিস্থাপনের ধারণাটি বেশ জোরেশোরে শোনা যাচ্ছে। অনেকে মনে করছেন, শিল্পীর সৃজনশীলতার জায়গা দখল করছে কৃত্রিম বুদ্ধিমত্তা। আসলেই কি তা-ই? পক্ষে-বিপক্ষে বিস্তারিত নানা তথ্য উঠে এসেছে গার্ডিয়ান-এর এক প্রতিবেদনে।
ডল-ই টু, মিডজার্নি, নাইটক্যাফে এআই, স্টেবল ডিফিউশন ইত্যাদি নানা সফটওয়্যারের মাধ্যমে সেকেন্ডের মধ্যেই চাহিদা অনুযায়ী, যেকোনো থিমের ছবি তৈরি করা সম্ভব। এতে কি মানুষের সৃজনশীলতা হুমকির মুখে পড়ছে? অনেকেই শঙ্কিত, আবার অনেকে এসব ইমেজ জেনারেটর নিয়ে সৃষ্ট নেতিবাচক ধারণাকে মনে করছেন ভিত্তিহীন।
ইলন মাস্কের প্রতিষ্ঠিত রিসার্চ কোম্পানি ওপেনএআই গত বছরের জানুয়ারিতে মেশিল লার্নিং মডেল ডল-ই প্রকাশ্যে আনে। এই মডেলটিকে আরও উন্নত করে এআই ইমেজ জেনারেটর ডল-ই টু-এর প্রকাশ করা হয় চলতি বছরের এপ্রিল মাসে। এরপর ২৮ সেপ্টেম্বর এটিকে সবার জন্য উন্মুক্ত করে দেওয়া হলে, ক্রয়ের পাশাপাশি বিনামূল্যেও অনেক ছবি তৈরি করতে পারছেন সবাই। যার ফলে মাত্র দুই মাস আগে উন্মুক্ত করে দেওয়া হলেও– এর সক্ষমতার কারণে ডিজিটাল দুনিয়ায় এখন সবার মুখে মুখে ডল-ই টু-এর নাম।
নরওয়েজিয়ান চিত্রকর এডভার্ড মাঙ্ক-এর আঁকার ধরণ অনুযায়ী বিখ্যাত মাপেট কারেক্টার কার্মিট দ্য ফ্রগ কিংবা দ্য লর্ড অব দ্য রিংস-এর অন্যতম প্রধান চরিত্র গলাম-এর তরমুজ খাওয়ার ছবি আঁকতে দেন – যা কিছুই নির্দেশ দিবেন, এআই ইমেজ জেনারেটর কয়েক সেকেন্ডের মাঝেই ছবি তৈরি করে দিতে পারে। আর এসব ছবির অবিকল ফলাফল দেখে আপনার তাজ্জব বনে না গিয়ে উপায় নেই।
যুক্তরাষ্ট্রভিত্তিক মাসিক ম্যাগাজিন কসমোপলিটন চলতি বছর প্রথমবারের মতো এআইয়ের মাধ্যমে তৈরি ছবি দিয়ে প্রচ্ছদ সাজিয়েছিল, যেটি বানাতে তাদের সময় লেগেছিল মাত্র ২০ সেকেন্ড।
আধুনিক প্রজন্ম মিম তৈরি এবং শেয়ার করতে প্রচণ্ড ভালোবাসে। আর মিম তৈরিতে এআই যেন প্রধান সাহায্যকারীর ভূমিকা নিতে যাচ্ছে। মাইক্রোব্লগিং সাইট টুইটারে ‘উইয়ার্ড ডল-ই জেনারেশনস’ নামে একটি একাউন্ট রয়েছে যেখানে মিম প্রেমীরা মিম তৈরি ও শেয়ারের আনন্দে মেতে থাকেন। এই একাউন্টটিতে অনুসারীর সংখ্যা ১০ লাখেরও বেশি।
সফটওয়্যারগুলোর দক্ষতা ছবি তৈরির মাঝে সীমাবদ্ধ নেই, এখন ছবির পাশাপাশি তৈরির করা যাচ্ছে চমৎকার সব ভিডিও; যেমন, গুগলের ‘ইমাজেন ভিডিও’ এবং ফেইসবুকের প্যারেন্ট কোম্পানি মেটা’র তৈরি মেইক-আ-ভিডিও। নিত্যনতুন সৃজনশীলতা নিয়ে রীতিমত চমক দিয়েই চলেছে এআই সফটওয়্যারগুলো।
তবে এআইয়ের এই নতুন শৈল্পিক দক্ষতা অনেক সৃজনশীল ব্যক্তি সাদরে গ্রহণ করছেন না। তাদের মধ্যে একজন হলেন, যুক্তরাষ্ট্রভিত্তিক কনসেপ্ট আর্টিস্ট এবং ইলাস্ট্রেটর আর. জে. পামার। ডল-ই টু-এর মাধ্যমে তৈরি সূক্ষ্ম গঠনশৈলীর ফটোরিয়েলিজম দেখে তিনি বেশ ‘অস্বস্তির’ মুখে পড়েন।
পামার বলেন, ‘ভবিষ্যতে এটি কেবল আমার শিল্পের ক্ষেত্রে কী প্রভাব ফেলবে তা নয়, আমার সবচেয়ে বড় উদ্বেগের বিষয় হলো– মোটাদাগে সৃজনশীল মানুষের শিল্পগুলো নিয়ে।’
এআই ইতোমধ্যে নিজেকে মানুষের চেয়ে শ্রেষ্ঠতর প্রমাণ করেছে। দাবা খেলা ছাড়াও ২০১৬ সালে গুগলের ডিপ মাইন্ড কম্পিউটারের আলফাগো প্রোগ্রাম আরও একটি জটিল বোর্ডগেম- গো’র এক সেরা খেলোয়াড়কে হারিয়ে দেয়।
কিন্তু, সম্প্রতি মৌলিক কিছু, বিশেষ করে সৃজনশীল কিছু তৈরি করে এআইয়ের দক্ষতা যেন নতুন মাত্রা পেয়েছে। এআই ইমেজ জেনারেটরগুলো কোনো লেখার বর্ণনার ওপর ভিত্তি করে– সহজেই ছবি বানিয়ে দিতে পারে। শুধু তা-ই নয়, এআই স্পিচ-জেনারেশন-এও (কথোপোকথন তৈরি) এসেছে অভূতপূর্ব অগ্রগতি। জিপিটি-থ্রি নামক ল্যাঙ্গুয়েজ মডেল সাবলীলতার অনেক শীর্ষে পৌঁছে গেছে।
মানুষের কাছাকাছি পর্যায়ের ক্ষমতা দেখে গুগলের কথোপোকথন-বিষয়ক প্রযুক্তি ‘ল্যামডা’কে (দ্য ল্যাঙ্গুয়েজ মডেল ফর ডায়ালগ অ্যাপ্লিকেশন) সংবেদনশীল অর্থাৎ অনুভূতিসম্পন্ন বলেছিলেন, কোম্পানিটির সফটওয়্যার প্রকৌশলী ব্লেক লেমোইন। অবশ্য এমন মন্তব্য করার কারণে তাকে বরখাস্তও করা হয়েছিল।
আরও অবাক করার বিষয় হলো, এআই প্রযুক্তি এখন কোনো সংগীতশিল্পীর স্টাইল অনুসরণেও গানের সুর করতে পারে। এক শিল্পীর গান দিয়ে দিন, কমবেশি একই ধাঁচে এআই গানটির সুরের আশুরচনা করতে পারবে। ২০১৯ সালে প্রকাশিত নিউ সায়েন্টিস্ট-এর এক প্রতিবেদনের বলা হয়, বিখ্যাত জার্মান সুরকার এবং সংগীতশিল্পী জোয়ান সেবাস্টিয়ান বাখ-এর গানকে ভিত্তি করে এআই এমন গান তৈরি করেছে যা মানব বাদকদলের পক্ষে বাজানো সম্ভব নয় বলেও মনে করেন অনেকে।
এধরনের সৃজনশীল প্রযুক্তিকে বলা হয় জেনারেটিভ এআই। ‘ডিফিউশন’ প্রক্রিয়ার মাধ্যমে এটি কাজ করে। মূলত, এআই প্রযুক্তিকে প্রশিক্ষণ দেওয়ার উদ্দেশ্যে বিশাল ডেটাবেজকে একত্র করা হয়। এরপর এক প্রাযুক্তিক প্রক্রিয়ার মাধ্যমে এআই ডেটাবেজের তথ্যের প্রতিচ্ছবি ফুটিয়ে তোলে, কিন্তু অবিকল নয় এমন নতুন আধেয় (কন্টেন্ট) তৈরি করে। যেমন, ‘কুকুর’ লেখাযুক্ত লাখ লাখ ছবি দেখলে– এআই তার ডেটাবেজে থাকা পিক্সেলগুলোকে নির্দিষ্ট আকারে এনে একটি সম্পূর্ণ নতুন কুকুরের ছবি আঁকতে পারবে।
তবে এআই ইমেজ টুল এখনো ‘পার্ফেক্ট’ নয়; এখনো অনেক ভুলত্রুটি রয়ে গেছে। অনেক সময় হয়তো মানুষের হাতের ছবি তৈরিতে সমস্যা করে, কিংবা অঙ্গপ্রত্যঙ্গের অনুপাত সঠিক হয় না এবং অনেক সময় লেখার ক্ষেত্রেও যথার্থতা মেনে চলতে পারে না।
এদিকে, এআই ইমেজ টুলগুলোর ব্যবহার সুবিধাজনক হওয়ায় অনভিজ্ঞ ব্যক্তিরাও আশ্চর্য করে দেওয়া ডিজিটাল ক্যানভাস তৈরি করতে পারেন। ইন্টারনেট ব্যবহারকারীরা এই সুপারচার্জড সৃজনী সম্ভাবনাকে বেশ সাদরে গ্রহণ করেছেন। আবার অনেক শিল্পী এই নতুন প্রযুক্তির নৈপুণ্যকে কাজে লাগাচ্ছেন ‘মিমিক্রি’ বা অনুকরণে। ছবি তৈরির জন্য অনেকে ইমেজ জেনারেটরগুলোতে কোনো বিখ্যাত চিত্রশিল্পীর নাম জুড়ে দেন যাতে করে নতুন ছবিটি সেই শিল্পীর কাজের ঘরানার হয়। যেমন, সাধারণ একটি কমলা রাখা পাত্রের ছবিকে চিত্রশিল্পী পাবলো পিকাসোর স্টাইল অনুকরণে এক চোখ-ধাঁধানো ছবিতে পরিণত করতে পারে এই টুলগুলো।
এক্ষেত্রে এআই ডেটাবেজে থাকা বিলিয়ন বিলিয়ন ছবির ওপর প্রশিক্ষিত, যেগুলোর কপিরাইট অনেক জীবিত শিল্পীর থাকতে পারে। এতেই হয়ে যায় ঝামেলা। তাদের শিল্প কর্মের চুরি বলে অনেকে এ ব্যাপারে যথেষ্ট ক্ষেপেও গেছেন।
এমনি একজন কনসেপ্ট আর্টিস্ট এবং ইলাস্ট্রেটর হলেন গ্রেগ রুটকোস্কি, যিনি সোনালী আলো মিশ্রিত কাল্পনিক দৃশ্য আঁকার জন্য বিখ্যাত। এআই টুল দিয়ে ছবি আঁকার জন্য সফটওয়্যারগুলোতে বহুবার উচ্চারিত হয়েছে তার নাম। ফলে মিডজার্নি এবং স্টেবল ডিফিউশনের মতো সফটওয়্যারে তার কাজের অনুরূপ কাজ সৃষ্টি করা হচ্ছে তার অনুমতি না নিয়েই।
গ্রেগ বলেন, ‘এসব সফটওয়্যার ঠিকঠাক এসেছে কেবল এক মাসের মতো হলো। এতেই এত কাজ চুরি হয়েছে, আর বছর হয়ে গেলে কী হবে! এআই আর্ট দিয়ে ভরা ইন্টারনেটের দুনিয়ায় আমি নিজের কাজগুলোই সম্ভবত আর খুঁজে পাব না। এটি খুব উদ্বেগের বিষয়।’
এআই টুলগুলোকে ঠিক কোন কোন ডেটা বা কোড দিয়ে প্রশিক্ষণ দেওয়া হয়- তা স্টেবল ডিফিউশন প্রকাশ করলেও, প্রকাশ করতে অস্বীকৃতি জানায় ওপেনএআই।
হ্যাভ আই বিন ট্রেইনড নামক একটি টুল প্রতিষ্ঠা করেছে শিল্পীগোষ্ঠী স্পনিং। স্টেবল ডিফিউশনে প্রশিক্ষণের জন্য ব্যবহৃত পাঁচশো কোটির অধিক ছবির মাঝে নিজের ছবি আছে কি না তা খুঁজতে শিল্পীদের সাহায্য করে স্পনিং। এছাড়াও ভবিষ্যতে এরূপ প্রশিক্ষণ সেটে নিজেদের ছবি থাকবে কি না তা বাছাই করতেও শিল্পীদের সাহায্য করে এটি।
কিন্তু কনসেপ্ট আর্ট অ্যাসোসিয়েশন (সিএএ) জোর দিয়ে বলে যে, ক্ষতি এর মধ্যেই হয়ে গেছে কারণ ইতোমধ্যে শিল্পীদের অনুমতি ছাড়াই তাদের কাজের ওপর ভিত্তি করে টুলগুলোকে প্রশিক্ষণ দেওয়া হয়েছে।
সিএএ-এর বোর্ড সদস্য এবং ইলাস্ট্রেটর কার্লা ওর্টিজ বলেন, “ব্যাপারটা অনেকটা এমন যে আমার জিনিস ছিনতাই করা ব্যক্তিই যেন বলছেন, ‘আপনি কি চান আমি আপনাকে ছিনতাই না করি?’
কার্লা ওর্টিজ স্টেবিলিটি এআই-এর বাণিজ্যিক অংশ ড্রিমস্টুডিও নিয়ে বেশি আপত্তি জানান। তিনি বলেন, “এই কোম্পানিগুলো অনুমতি ছাড়াই সবার কপিরাইট থাকা এবং ব্যক্তিগত ডেটা ব্যবহার করছে। আবার বলছে ‘এ নিয়ে আমাদের কিছু করার নেই।”
কিন্তু কোম্পানিগুলো কোনো পদক্ষেপ না নিলে আর কারও কিছু করার আছে-এমনটাও সন্দেহজনক। যুক্তরাজ্যের আইন কপিরাইট করা সৃজনশীল কাজগুলো ব্যবহারে এআই কোম্পানিগুলোকে আরও বেশি স্বাধীনতা দিতে পারে এবং তা পরবর্তীতে বাণিজ্যিক উদ্দেশ্যে প্রয়োগ করা যাবে বলে উদ্বেগ প্রকাশ করে সিএএ।
অন্যদিকে মার্কিন যুক্তরাষ্ট্রে কপিরাইট আইন নিয়ে আলোচনার জন্য সিএএ সরকারি কর্মকর্তাদের সাথে দেখা করেছে এবং এআইয়ের এ ক্ষেত্রের এমন অপব্যবহার কীভাবে ঠেকানো যায় তা নিয়ে তাদের মাঝে আলোচনা চলছে।
কপিরাইট লঙ্ঘন বাদেও আরও একটি বড় সমস্যার দিকে আঙুল তোলেন আরজে পামার; এই এআই টুলগুলো কি সমগ্র সৃজনশীল গোষ্ঠীকে ঝুঁকিতে ফেলবে?
স্টক ছবির পরিবর্তে জায়গা করে নিচ্ছে এআই টুল দ্বারা তৈরি ছবি। বিখ্যাত ছবি লাইব্রেরি শাটারস্টক সম্প্রতি তাদের ছবিতে ডল-ই-এর ব্যবহার করতে ওপেনএআই-এর সাথে চুক্তিবদ্ধ হয়েছে। পামার মনে করেন, অ্যালবামের প্রচ্ছদ, বই বা প্রবন্ধের জন্য আঁকা ইলাস্ট্রেশনের মতো চিত্রকর্মগুলো এআই থেকে প্রতিদ্বন্দ্বিতার সম্মুখীন হতে পারে যা বাণিজ্যিক চিত্রকর্মের একটি উদীয়মান ক্ষেত্রকে দুর্বল করে দেবে।
তবে এআই ইমেজ জেনারেটরের মালিকরা বলছেন অন্য কথা। তাদের মতে, এই টুলগুলো শিল্পকে গণতান্ত্রিক করে তোলে। স্টেবিলিটি এআইয়ের প্রতিষ্ঠাতা এমাদ মোস্তাক বলেন, ‘বিশ্বের অনেক কিছুই সৃজনশীলভাবে কোষ্ঠবদ্ধ। কিন্তু সবাই যদি এআইকে কাজে লাগিয়ে প্রাযুক্তিকভাবে নিপুণ ছবি সৃষ্টি করতে পারে, এটিও তো সৃজনশীলতার অংশ।’
এআইকে সৃজনশীলতার কৃতিত্ব দেওয়া যায় কি না-এই বিষয়টি বেশ বিতর্কিত। অক্সফোর্ড ইউনিভার্সিটির গণিতবিদ মার্কুস ডু সটি মনে করেন, “ডল-ই সহ অন্যান্য ইমেজ জেনারেটরগুলো সম্ভবত এক প্রকার ‘সম্মিলিত’ সৃজনশীলতার কাছাকাছি আসতে পারে। কারণ লাখ লাখ ডেটাসেটের ধরন অনুসরণ করে নতুন ছবি তৈরি করতেই এই টুলগুলোর অ্যালগরিদম বানানো।”
অ্যানা রিডলার একজন লন্ডনভিত্তির ডিজিটাল আর্টিস্ট। মার্কুসের মতে, অ্যানার কাজগুলো ‘ট্রান্সফর্মেশনাল’ সৃজনশীলতার কাছাকাছি পর্যায়ে পড়ে যা-তে সম্পূর্ণ নতুন ধাঁচ বা স্টাইলে কিছু সৃষ্টি করা হয়।
তবে সৃজনশীলতার এমন বিধিবদ্ধ সংজ্ঞা প্রদানে অ্যানা আপত্তি তোলেন। তিনি বলেন, “এর মাধ্যমে চিত্রশিল্পকে অনুভূতি বা ধারণা প্রকাশ এবং সত্যের সন্ধান নয়, বরং ‘আকর্ষনীয় ওয়ালপেপার’ হিসেবে বিবেচনা করা হয়।”
একজন কন্সেপচুয়াল আর্টিস্ট হিসেবে অ্যানা জানেন এআইয়ের অক্ষমতা বা দুর্বলতা কোন কোন জায়গায় রয়েছে। “এআই কন্সেপ্ট বা ধারণা ব্যবহার করতে পারে না। সময়, স্মৃতি, চিন্তা, আবেগ – এসবকিছুর মিশ্রণ মানুষের অনন্য দক্ষতা যা এআইয়ের কাজ থেকে তাদের কাজকে আলাদা করে; নিছক দেখতে সুন্দর এমন কিছু নয়, মানুষের এসব বৈশিষ্ট্য সত্যিকারের ‘চিত্রশিল্প’ তৈরি করে,” বলেন তিনি।
অ্যানা এবং আরেক ডিজিটার আর্টিস্ট ম্যাট ড্রাইহার্স্ট মনে করেন, এআইয়ের ‘শিল্পী প্রতিস্থাপন’-এর ধারণা মানুষের শৈল্পিক প্রক্রিয়াকে অবমাননা করে।
ম্যাটের মতে, গণমাধ্যমগুলো ‘আতঙ্ক-সৃষ্টিকারী আখ্যান’ বা এলার্মিং ন্যারেটিভ তৈরি করছে। তিনি বলেন, ‘গণমাধ্যমগুলোতে শিল্পীদের আতঙ্কিত করার এক প্রবণতা দেখা যায়। বিষয়টি আমাকে খুবই বিরক্ত করে।’
এটি সম্ভব যে, ছবি তৈরির এই টুলগুলো নিয়ে যে নেতিবাচক আলোড়ন তৈরি হয়েছে তা বাস্তবতাকে ঢেকে রাখতে পারে। ইমেজ জেনারেটরগুলোকে ‘বুদ্ধিমান মাধ্যম’ বা ইন্টেলিজেন্ট মিডিয়ার অংশ মনে করেন মোস্তাক।
ডিজনির কন্টেন্ট বাজেট ১০ বিলিয়ন ডলার এবং সমগ্র গেমিং ইন্ডাস্ট্রির মূল্য ১৭০ বিলিয়ন ডলারের বেশি উল্লেখ করে মোস্তাক বলেন, ‘এআইয়ের এ ক্ষেত্রটির এক ট্রিলিয়ন ডলার মূল্যের সম্ভাবনা রয়েছে। বিবিসি থেকে ডিজনি, সবার কন্টেন্ট আরও জীবন্ত করে তুলবে ইমেজ জেনারেটর মডেলগুলো।’
এসডব্লিউএসএস/১৫১০
আপনার মতামত জানানঃ