ডিপফেকস এবং গভীর ভিডিও প্রতিকৃতি - সেগুলি কী এবং তাদের পার্থক্যগুলি কী?

আপনি নিশ্চয়ই জানেন ডিপফেক কী, তবে আপনি এটি জানেন না যে এটি কী বা এর প্রকৃত অর্থ। আপনি হয়ত জানেন না যে এখানে বিভিন্ন প্রযুক্তি রয়েছে যা নকল ভিডিও এবং অডিও তৈরি করতে পারে।

আমরা সবাই "ফটোশপড" চিত্রগুলির সাথে পরিচিত এবং তারা কতটা এগিয়ে গেছে। আমরা ভিডিও প্রতিক্রিয়া (ভিএফএক্স) এবং কয়েক দশক ধরে সিনেমাতে ব্যবহৃত হচ্ছে এমন বিশেষ প্রভাবগুলিও প্রবর্তন করি। তবে ডিপফেকসের কারণে ভুয়া মিডিয়ার একটি নতুন যুগ আসছে।

ডিপফেক এবং ডিপ ভিডিও পোর্ট্রেট প্রযুক্তি হ'ল হলিউডের সিনেমা, ইউটিউব ভিডিও এবং হ্যাঁ, পর্নোগ্রাফিতে ব্যবহৃত দুটি অনুরূপ তবে ভিন্ন কৌশল। তবে এই প্রযুক্তিটি আসলে কী এবং এটি কীভাবে কাজ করে?

আপনি যদি এখনও কোনও মুভি অভিনেতা সম্পর্কে নিকোলাস কেজের মুখের নিন্দার ভিডিও না দেখে থাকেন তবে আপনি সম্ভবত প্রচুর সোশ্যাল মিডিয়া "ফিল্টার" বা "মুখোশ" দেখেছেন যা আপনাকে একটি বিড়াল বানায়, একটি কুক যোগ করে। আপনার মাথায় একটি টুপি রাখুন বা এটি একটি রঙ করুন।

আপনি সম্ভবত বাজফিড ভিডিওগুলি দেখেছেন, যেখানে কৌতুক অভিনেতা এবং ছদ্মবেশী জর্ডান পিল ভিডিওতে দেখিয়েছেন যে কেউ কীভাবে তাদের মুখের ব্যবহার করতে পারেন (এই ক্ষেত্রে প্রাক্তন রাষ্ট্রপতি বারাক ওবামা) এবং এমন কিছু বলেছিলেন যা তিনি কখনও করেননি।

আপনি এমনকি শুনে থাকতে পারেন যে ওয়ান্ডার ওম্যান তারকা গাল গাদোট একজন রেডডিট ব্যবহারকারী দ্বারা "গভীরতা" নামে একটি নকল সিনেমাতে একটি অনুমিত প্রাপ্তবয়স্ক ভিডিওতে উপস্থিত হন appears গাদোটের মুখ গত ডিসেম্বরে একজন পর্ন তারকার শরীরে যুক্ত হয়েছিল। Deepfakes।

তাহলে ডিপফাকে কী?

আপনি ভাবতে পারেন ডিপফেকসের ভিত্তিটি "মুখ প্রতিস্থাপন"।

ডিপফেক একটি এআই-সক্ষম হওয়া ভিডিও যা কোনও উত্স ব্যক্তির একাধিক ফটো (সাধারণত শত বা হাজার) নেওয়ার মাধ্যমে তৈরি করা হয়। এই ছবিগুলি ইনস্টাগ্রাম, ফেসবুক, স্ন্যাপচ্যাট এমনকি গুগলের চিত্র অনুসন্ধান সহ বেশ কয়েকটি উত্স থেকে ডাউনলোড করা যেতে পারে।

ডিপফেক এআই উত্স চিত্রগুলির মুখটি ম্যাপ করবে এবং আপনি যে ছবিগুলি দেখছেন তার উপর ভিত্তি করে একটি 3 ডি মডেল তৈরি করবে। মডেলটি পরিচালকের মুখ এবং বৈশিষ্ট্যগুলি ম্যাপ করে:

উত্স: https://hackernoon.com/building-a-facial-recognition-pipline-with-DP-learning-in-tensorflow-66e7645015b8 লিখেছেন কোল মারে

প্রোগ্রামটি একটি টার্গেট ফেস সহ একটি উত্স ভিডিও সরবরাহ করে যা ব্যবহারকারী পরিবর্তন করতে চায়। এআই ভিডিওতে ব্যক্তির চেহারাও ম্যাপ করে এবং আরও 3-ডি মানচিত্রের মডেল তৈরি করে।

সিএমইউ-র গবেষণার অধ্যাপক সাইমন লুসি নিজেকে তার কাঁচের সরঞ্জাম খুচরা বিক্রেতার জন্য তৈরি ফেস-ম্যাপিং সফটওয়্যারটি প্রদর্শন করতে নিজেকে মডেল হিসাবে ব্যবহার করেন। ক্রেডিট: সাইমন লুসি / সিএমইউ

এআই লক্ষ্য মডেলের সাথে উত্সের মডেলটির সাথে মিলতে শুরু করে। এটি চিত্রগুলি (অনুশীলন ডেটা) এর মাধ্যমে মুখগুলি "শিখায়" যা দেখতে কিছুটা দৃষ্টিনন্দন:

ফেস রিপ্লেসমেন্ট এক্সারসাইজ উদাহরণ - ইলন মাস্ক এবং জেফ বেজোস দ্বারা আদি রবার্টসন, উত্স: https://www.theverge.com/2018/2/11/16992986/fakeapp-ਦੀਪফেকস- হাই- পৃষ্ঠ- সোয়াপিং

এআই তখন লক্ষ্য ভিডিওর 3-ডি মডেলের ফটো থেকে উত্পন্ন 3-ডি মুখটি সরিয়ে দেয় এবং একটি ভিডিও তৈরি করে যা মুখ, মুখ, চোখ ইত্যাদির গতিপথের সাথে মেলে। আসল চেহারা

ডিপফেকের উত্স হ'ল একটি সিরিজ, এবং ডিপফেকের ফলাফল মুখোমুখি ভিডিও যা একটি উদাহরণ হিসাবে পরিবর্তিত হয়েছে:

এই গভীর ভিডিও প্রতিকৃতিটি কী আলাদা করে তোলে?

"ডিপফেক" এবং "ডিপ ভিডিও পোর্ট্রেট" (ছোট করার জন্য ডিভিপি) এর মধ্যে পার্থক্য দুটি মূল উপায়ে আসে:

  1. ডিভিপি থেকে ভিডিও মুখ প্রতিস্থাপন করে না, তবে কেবল বৈশিষ্ট্যগুলি নিয়ন্ত্রণ করে
  2. ডিভিপি'র উত্স ব্যক্তিগত ফটোগুলি থেকে নয়, সরাসরি অভিনেতা থেকে আসে।

ডিভিপি কোনও মুখের প্রতিস্থাপন নয়। এটি মুখোমুখি হেরফের। ভিডিও পুতুল।

এই নিবন্ধের শুরুতে লিঙ্কযুক্ত ভিডিওতে দেখা গেছে যে ওবামা জাল ভিডিও সম্পর্কে কথা বলছেন, একটি নকল নয়, ডিভিপি-র উদাহরণ হিসাবে। এমন একজন অভিনেতা আছেন যার চেহারা মানচিত্রে প্রদর্শিত হয়েছে এবং আপনি যদি লক্ষ্য মুখটি পরিবর্তন না করে কেবলমাত্র লক্ষ্য মুখটি সরিয়ে নিয়ে থাকেন তবে ফলাফলটি ফটোগ্রাফিক গভীরতার চেয়েও বেশি বিশ্বাস করা যায়।

ডিভিপি নির্মাতারা লক্ষ্যযুক্ত ঝলকানো, মুখ খোলার, ভ্রু উত্থাপন এবং মাথা ঘোরানোর মতো জিনিসগুলি করতে পারে। পরিবর্তে, গভীর ভিডিওগুলি মূল ভিডিও ক্রিয়াগুলি থেকে বিভ্রান্ত করতে পারে না। এই কারণেই ডিভিপিকে গভীর কোনও কিছুর চেয়ে বেশি বিশ্বাস করা যায়।

এই "ফেস পেইন্টিং এবং পুনরায় সংহতকরণ" প্রযুক্তি কীভাবে কাজ করে সে সম্পর্কে আরও গভীরতার সাথে নজর দেয়:

স্ন্যাপচ্যাট বা ইনস্টাগ্রাম ফিল্টার মাস্কটি ডিভিপি, ডিপফেক নয়। এটি কারণ আপনি (লক্ষ্যগুলি মুখগুলি পরিবর্তন করে না) তবে আপনার মুখ ম্যাপ করা হয়েছে এবং অ্যাপটি কেবল আপনার মুখের জন্য কিছু বন্ধ করে:

শব্দ জাল এবং গভীর ভিডিও প্রতিকৃতি

আর একটি ধরণের নকল সামগ্রী রয়েছে যা সম্প্রতি উন্নত হয়েছে এবং আরও জনপ্রিয় হয়েছে - শব্দ তৈরি করে creating

২০১ 2016 সালে, অ্যাডোব ম্যাক্স সৃজনশীল সম্মেলনে অ্যাডোব ভোকো প্রবর্তন করেছিলেন: একটি অডিও স্যুট যা ব্যবহারকারীদের তারা কী চায় তা বলতে সহায়তা করে। পাঠ্যটি ভাষণে অনুবাদ করার কথা ভাবুন তবে কারও আসল ভয়েসের উপর ভিত্তি করে।

সংস্থাটি দাবি করেছে যে 20 মিনিটের শ্রোতা ভোকোকে একটি আসল উত্সের মতো ভোকাল ট্র্যাক প্রকাশ করতে অনুমতি দেবে। আউটপুটটি সফ্টওয়্যার চালিত একটি কম্পিউটার দ্বারা উত্পাদিত হয়।

অ্যাডোব ভোকো 2016 সালের পর সত্যিই শোনা যায় নি, সম্ভবত গোপনীয়তা এবং গোপনীয়তার বিষয়টি উত্থাপিত হওয়ার পরে। এটি একটি "ধারণা ফোরামে" বৈশিষ্ট্যযুক্ত যা নতুন পণ্য হিসাবে ঘোষণা করা হয়নি। এটি কৌতূহল, উত্তেজনা এবং বিতর্ক ছড়ায়, কিন্তু ঠিক এটি প্রকাশের প্রত্যাশা করে না।

এখন যে ধারণা এবং প্রযুক্তি উপলব্ধ রয়েছে, অন্য সংস্থাগুলি তাদের নিজস্ব সাউন্ড প্রযুক্তি প্রকাশ করেছে। লাইয়ারবার্ড একটি পরিষেবা প্রকাশ করেছে যা কেবলমাত্র 30 টি বাক্য বাক্য (ভোকোর জন্য প্রায় 20-মিনিটের ডেটার ভিত্তিতে) ভিত্তিতে আপনার জন্য "ভোকাল অবতার" তৈরি করবে।

ভোকোর পণ্য উত্পাদন করতে স্থানীয় কম্পিউটিং সংস্থাগুলির প্রয়োজন থাকলেও লিরবার্ড বড় আকারের ক্লাউড রিসোর্স ব্যবহার করে এবং ফলস্বরূপ, উত্পাদনকে তাত্পর্যপূর্ণ করে তোলে। 20 মিনিটের প্রাথমিক বক্তৃতা শৈলীর বিপরীতে 30 টি নির্দিষ্ট বাক্যও লেয়ারবার্ডের প্রয়োজন যা হতাশা এবং অন্যান্য দুর্বলতাগুলি হ্রাস করতে পারে।

ডিভিপি সহ অডিও জালিয়াতি আত্মবিশ্বাস বাড়িয়ে তুলতে পারে। এটি কারণ আপনি এই ধারণাটি শুনছেন না যে কেউ একটি ছাপ হারাতে পারে, তবে লক্ষ্য ব্যক্তির নিজস্ব ভয়েসের আরও নিবিড় উপস্থাপনা।

হাইব্রিড প্রযুক্তি

ফেসসাপ হ'ল এমন একটি প্রোগ্রাম যা আপনাকে ডিপফেকের মুখোমুখি সংমিশ্রণ করতে দেয় তবে বাস্তব সময়ে খুব কমই আর কারও মুখের মুখোমুখি হতে পারে। ডিপফেক এবং ডিভিপি সংযুক্ত করে।

উপসংহার

এই প্রযুক্তিগুলির উন্নতি অব্যাহত থাকবে। যদিও অনেকগুলি ব্যবহার মজাদার এবং কৌতুকপূর্ণ তবে এই প্রযুক্তিটির বিশাল প্রভাব রয়েছে।

ডিপেক্স এবং ডিভিপি নিঃসন্দেহে সত্য, বিশ্বাস এবং গোপনীয়তার আমাদের দৃষ্টিভঙ্গিকে প্রভাবিত করবে। তবে নৈতিকতা, সমস্যা এবং সামাজিক প্রভাবগুলি (ভাল এবং খারাপ) সম্পর্কে আলোচনা এই নিবন্ধের আওতার বাইরে।

এখনও অবধি, একমাত্র সমাধান হ'ল আপনি কী দেখেছেন এবং শুনেছেন তা প্রশ্ন করা।

মাইস পেক্সেলস ছবি দ্বারা ছবি