2019 সালে বিষয়বস্তু সংযোজন: মানব বনাম এআই

ইন্টারনেট এমনকি এটি ইতিবাচক সমস্ত সহ, খুব অন্ধকার এবং বিরক্তিকর জায়গা হতে পারে। নাম প্রকাশের ঝালটি লোকদের পক্ষে নির্দিষ্ট উপায়ে আচরণ করা সহজ করে দেয় যা অন্যথায় সমাজ দ্বারা উপহাস করা যায়। এই নিবন্ধটি আপত্তিকর সামগ্রীকে মাঝারি করার বর্তমান পন্থাগুলি কী তা আবিষ্কার করে এবং আপনাকে আরও অবগত সিদ্ধান্ত নিতে সহায়তা করে।

এটি ২০১২ এর এবং আমরা আগের চেয়ে দ্রুত সামগ্রী আপলোড এবং গ্রাস করছি। একমাত্র 2017 সালে, 1.2 ট্রিলিয়ন ফটো তোলা হয়েছিল এবং তাদের মধ্যে কয়েক বিলিয়ন অনলাইনে ভাগ করে নিয়েছে - যা প্রতি বছরে গড়ে ~ 200 ডলার ফটো (বিশ্বের জনসংখ্যা 7 বিলিয়ন ধরে ধরে) ’s ফেসবুক নিজেই এক বিস্ময়কর হার 300 300 মিলিয়ন ফটো প্রতিদিন আপলোড করা হয় এবং 7,500 মডারেটরদের একটি বাহিনী এই বিষয়বস্তু নিয়ন্ত্রণ করতে কাজ করে।

সূত্র: বিজনেসইনসাইডার

পর্ন সর্বত্র আছে

এ জাতীয় বিশাল স্পাইক সহ, সন্দেহজনক প্রকৃতির সামগ্রী আপলোড করার ক্ষেত্রে এবং লোকেদের স্পষ্টতই আমরা দ্রুত বৃদ্ধি পেয়েছি, আমরা এটি নিয়ন্ত্রণে সংগ্রাম করছি। আপনি যা ভাবেন তা সত্ত্বেও বড় বড় সামাজিক নেটওয়ার্কগুলি পর্নির মতো এনএসএফডাব্লু কনটেন্টের সাথে বন্ধ রয়েছে। এটি একটি বিড়াল এবং মাউস গেম, যেখানে এই জাতীয় সামগ্রী ফিল্টার করা হয় এবং ব্যবহারকারী / হ্যাশট্যাগ / গোষ্ঠী নিষিদ্ধ করা হয় তবে তারা কেবল স্মার্ট এবং ধরা আরও শক্ত করে ফিরে আসে। এখানে একটি নিবন্ধের স্ক্রিনশটটি অশ্লীল আরবিক হ্যাশট্যাগগুলি ইনস্টাগ্রামে পর্ন ভাগ করে নেওয়ার জন্য ব্যবহৃত হচ্ছে about

সূত্র: ডেইলি এক্সপ্রেস

আমাদের বেশিরভাগ সামগ্রীর ব্যবহার মোবাইলে চলে যাওয়ার সাথে সাথে অ্যাপল (অ্যাপ স্টোর) এবং গুগল (প্লে স্টোর) আমরা যে সামগ্রী দেখছি তার গেট রক্ষক।

চাইল্ড পর্নোগ্রাফি সন্ধানের পরে অ্যাপল টুম্বলার অ্যাপটি অ্যাপ স্টোর থেকে সরিয়ে নিয়ে যাওয়ার সাম্প্রতিক ইস্যুটি আমরা সকলেই শুনেছি, তবে এটি এমন একটি প্ল্যাটফর্মের উদাহরণ যা কনটেন্টকে সংযত করতে এবং দণ্ডিত হওয়ার জন্য লড়াই করে।

সূত্র: দ্য প্রান্ত

টাম্বলার এখনও বেঁচে থাকতে পারে এবং অবশ্যই সঠিক; তবে এমন বহু অ্যাপ্লিকেশন রয়েছে যেগুলি ব্যবহারকারীরাই সেনাবাহিনী ছেড়ে চলে যাওয়ার পরে ব্যর্থ হয়েছে কারণ এটি পর্ন এবং অন্যান্য আপত্তিকর সামগ্রীর ঘাঁটি হয়ে উঠেছে যা প্রশাসকরা নিয়ন্ত্রণ করতে পারেন নি।

আপনার চিন্তিত হওয়া উচিত কেন? যদি আপনি কোনও অ্যাপের মালিক ব্যবহারকারী-উত্পাদিত-সামগ্রী বা ইউজিসির সাথে এটি জনপ্রিয় হিসাবে পরিচিত হিসাবে কাজ করেন তবে আপনি সম্ভবত সম্মানজনক, অর্থনৈতিক বা এমনকি বড় আইনী ঝুঁকির মতো একাধিক ঝুঁকির মুখোমুখি হয়ে গেছেন। (দেখুন: ভারত ইবে প্রধানকে কারাগারে ফেলেছে)

তবে প্রথমে বুঝতে পারি যে "আপত্তিকর" হিসাবে কী বিবেচনা করা হয়েছে এটি আরও ভালভাবে নিয়ন্ত্রণ করতে সক্ষম হবেন যতটা সহজ হিসাবে আপনি প্রথমে এটি ভাবেন না।

"আপত্তিকর" সামগ্রী (?) এর সংজ্ঞা

বৈশ্বিক প্রেক্ষাপটে

বাম: শাকিরার ওরাল ফিক্সেশন আসল কভার; ডান: মধ্য প্রাচ্যে একই কভার

বিশ্বব্যাপী অপারেটিং এবং সামগ্রীর জন্য মান নির্ধারণ করা জটিল। বেশিরভাগ সংস্থাগুলি বিভিন্ন জনসাধারণ থেকে বিভিন্ন সংস্কৃতি সংবেদনশীলতা সহ ব্যবহারকারীদের জুড়ে একই নিয়ম আরোপের চেষ্টা করে। এবং সেখানেই তারা ব্যর্থ হয়।

বিশ্বব্যাপী প্রসারিত সংস্থাগুলি তাদের স্থানীয় সংস্কৃতি বিবেচনায় না নিলে প্রায়শই স্থানীয় প্রশাসনের সাথে সমস্যায় পড়েন। জুলাই 2018 সালে, ইন্দোনেশীয় সরকার জনপ্রিয় শর্ট মিউজিক ভিডিও তৈরির অ্যাপ্লিকেশন টিকটোককে নিষিদ্ধ করেছিল। ইস্যুতে রিপোর্ট করা একটি সংবাদপত্রের নিবন্ধের একটি অংশ এখানে দেওয়া হয়েছে:

মন্ত্রক জানিয়েছে যে অ্যাপটি নিষিদ্ধ করেছে কারণ এতে নেতিবাচক ভিডিও রয়েছে যা যুবকদের উপর খারাপ প্রভাব বলে মনে করা হয়…। ইন্দোনেশিয়ায় গণতান্ত্রিক অনুভূতি টিক টোকের বিরুদ্ধে পরিণত হচ্ছে যা ১৩ থেকে ১৫ বছর বয়সীদের মধ্যে জনপ্রিয় popular কিশোরদের ক্লিপগুলি উত্তেজক আচরণে জড়িত। এরকম একটি ভিডিওতে কিশোর নাচ দেখানো হয়েছে। এরপরে এটি একটি মৃতদেহ কেটে যায়, দৃশ্যত এই কিশোরীর এক আত্মীয়।

নগ্নতা / পর্ন ছাড়াও, এখানে নির্দিষ্ট আঞ্চলিক বিধি রয়েছে:

  • ধর্মীয় বিদ্বেষমূলক বক্তব্য সহিংসতা প্ররোচিত করে
  • একটি রাজনৈতিক এজেন্ডার জন্য জাল খবর এবং ছড়িয়ে
  • কোনও ব্যক্তি / সংস্থার বিরুদ্ধে মানহানিকর ভাষা

তালিকাটি আপনি যে অঞ্চলে প্রভাবশালীভাবে পরিচালনা করছেন এবং সেই ভূগোলটিতে বাকস্বাধীনতার মানদণ্ডের ভিত্তিতে চলে যেতে পারে

অরকুটের জন্য উইকিপিডিয়া পৃষ্ঠা থেকে এখানে একটি অংশ রয়েছে - এককালের জনপ্রিয় সামাজিক নেটওয়ার্ক:

২০০৮ সালে গুগল ঘোষণা করেছিল যে বেলো হরিজন্টে গুগল ব্রাজিল দ্বারা ব্র্যান্ডে অর্কুট পুরোপুরি পরিচালিত হবে এবং পরিচালিত হবে। এটি বৃহত্তর ব্রাজিলিয়ান ব্যবহারকারী বেস এবং আইনি সমস্যাগুলির বৃদ্ধির কারণে সিদ্ধান্ত নেওয়া হয়েছিল

এটি বিবেচনা করুন, মার্কিন-ভিত্তিক সামাজিক নেটওয়ার্কের পুরো অপারেশনগুলিকে এর স্থানীয় আইনগুলিকে আরও ভালভাবে মেনে চলার জন্য অন্য দেশে স্থানান্তরিত করা হয়েছিল।

কি নগ্নতা / পর্ন গঠন

এমনকি "নগ্নতা" বা "অশ্লীল" হিসাবে চিহ্নিত হওয়ার মূল সংজ্ঞাটি অত্যন্ত ব্যক্তিগত এবং সমাজের বিধি হিসাবে স্বেচ্ছাচারী। ইনস্টাগ্রামটি বিবেচনা করুন যা "পুরুষ স্তনের" কে অনুমতি দেয় তবে "মহিলা স্তনের" নিষিদ্ধ করে।

কিছু কিছু বিশেষ ক্ষেত্রে নগ্নতা দেখানোর অনুমতি দেয়।

টাম্বলার বিবেচনা করুন যা সম্প্রতি কিছু আকর্ষণীয় ব্যতিক্রম সহ এটির সামগ্রীর নিয়মের আপডেট করেছে:

নিষিদ্ধ সামগ্রীতে ফটো, ভিডিও এবং মানুষের যৌনাঙ্গে জিআইএফ, মহিলা-উপস্থাপক স্তনের বাম এবং চিত্র সহ যৌনক্রিয়া সম্পর্কিত কোনও মিডিয়া অন্তর্ভুক্ত রয়েছে। ব্যতিক্রমগুলির মধ্যে নগ্ন শাস্ত্রীয় মূর্তি এবং রাজনৈতিক বিক্ষোভ অন্তর্ভুক্ত যা নগ্নতা বৈশিষ্ট্যযুক্ত। নতুন নির্দেশিকা পাঠ্য বাদ দেয় না, তাই ইরোটিকা অনুমোদিত হয়। নগ্নতার বৈশিষ্ট্যযুক্ত চিত্রগুলি এবং শিল্পগুলি এখনও ঠিক আছে - যতক্ষণ যৌন ক্রিয়াকলাপ চিত্রিত হয় না - এবং তাই বুকের দুধ খাওয়ানো হয় এবং জন্মের পরেও

আসুন অন্য বড় সামাজিক নেটওয়ার্কগুলির জন্য সামগ্রীর নির্দেশিকা দেখুন:

আমি আশা করি তাদের বিষয়গত স্বভাবের কারণে বিষয়বস্তুর জন্য মান তৈরি করা সত্যই মুশকিল বলে আমি আমার বক্তব্যটি তৈরি করেছি।

সুতরাং আসুন ধরে নেওয়া যাক যে আপনি বিধিগুলির একটি বিস্তৃত প্রথম সেট তৈরি করেছেন যা আপনার আবেদনের জন্য কাজ করে। পরবর্তী পদক্ষেপটি হয় হ'ল মানব মডারেটরদের নিয়োগ দেওয়া, আপনার সম্প্রদায়ের উপর নির্ভর করে এই জাতীয় বিষয়বস্তুকে "প্রতিবেদন করা" বা তাদের সনাক্ত করতে এআই ব্যবহার করুন বা সাধারণত 3 এর মিশ্রণ রয়েছে।

হিউম্যান মডারেটর ব্যবহার করা

মানব মডারেটরদের নিয়োগের সময় আপনার যে মূল প্রশ্নের উত্তর দেওয়া দরকার সেগুলি হ'ল:

এটা কত টাকা লাগে? থ্রুপুট এবং প্রতিক্রিয়া সময় কি? তারা সাধারণত কীভাবে ভিডিওকে মূল্যায়ন করে? প্রবাহ দেখতে কেমন হবে? বিশেষত প্রান্তের ক্ষেত্রে সাবজেক্টিভিটি হ্রাস করার জন্য আপনি কীভাবে ক্লিয়ার-কাট স্ট্যান্ডার্ডগুলি সংজ্ঞায়িত করবেন?

আমরা এগিয়ে গিয়ে mode জন মডারেটর আউটসোর্সিং এজেন্সির কাছে পৌঁছেছি এবং তাদের মধ্যে ৪ টির কাছ থেকে অস্পষ্ট (ইশ?) প্রতিক্রিয়া পেয়েছি। তারা সাধারণত বিপিওগুলি হ'ল স্বল্প বেতনের উন্নয়নশীল অর্থনীতির ভিত্তিতে কয়েকশ ডেটা-এন্ট্রি ঠিকাদার। আপনি তাদের প্রতিক্রিয়া এখানে পেতে পারেন।

Taskus
Scale.ai
Webpurify
Foiwe
Olapic
Assivo
ইউজিসি মডারেটর
  1. ব্যয়:

দামের প্রতিক্রিয়া আমরা পেয়েছি।

ইউজিসি মডারেটরগুলি images 0.01 / ইমেজের দামের চিত্রগুলির মধ্যে 3 টির মধ্যে সস্তার বিকল্প।

২. মোড় ঘুরিয়ে দেওয়ার সময়: ওয়েবপুরিফায় <2 মিনিটের সময় পরিবর্তনের সময় উল্লেখ করা হয়েছে। বাকি সবাই এ সম্পর্কে খোলামেলা। উচ্চমাত্রার সাথে কাজ করার সময়, পরিষেবাটি রিয়েল-টাইম ভিত্তিতে কাছাকাছি কাজ করতে মাঝারিদের একটি বড় কর্মী বজায় রাখতে হবে যা কারওর পক্ষে আবশ্যক।

৩. ভিডিও: ওয়েবপুরেফাই ভিডিওগুলি $ ০.০৫ / মিনিটে করার কথা উল্লেখ করে।

অন্য সরবরাহকারী, ইউজিসি মডারেটরগুলির দাম $ 2 / ঘন্টা। ধরে নিচ্ছি যে তারা প্রতি মিনিটে 5 1-মিনিটের ভিডিও চেক করতে পারে, এটি ~ $ 0.07 / মিনিটের ভিডিও

ইউটিউবের জন্য এটি বিবেচনা করুন যেখানে প্রতি মিনিটে 400 ঘন্টা ভিডিও আপলোড হয়। = 2400 মিনিটের ভিডিও / মিনিট।
এক বছরে মোট মিনিটের সংখ্যা অনুসারে (60 x 24 x 365) এবং এটি প্রতি বছর $ 1.2 বিলিয়ন ডলার ব্যয়বহুল ব্যয়!
এমনকি ভলিউম ছাড়ের জন্য 50% বিবেচনা করা, ~ 600 মিলিয়ন।

কোন বিষয়বস্তুতে থাকার অনুমতি রয়েছে তা সিদ্ধান্ত নেওয়ার বিষয়গত প্রকৃতি স্থানে নির্দিষ্ট সংখ্যক মানব মডারেটর রাখা গুরুত্বপূর্ণ করে তোলে। তবে আপনি দেখতে পাচ্ছেন যে এগুলি খুব ব্যয়বহুল খুব দ্রুত পরিণত হতে পারে।

মানসিক আঘাত

যোগ করার জন্য একটি গুরুত্বপূর্ণ বিষয় হ'ল চাকরিটি খুব ঝামেলা করছে এবং এটি ব্যক্তি এবং দিনের বাইরে করা ট্রমাজনিত কারণ হতে পারে। একজন প্রাক্তন কন্টেন্ট মডারেটর ফেসবুকের বিরুদ্ধে মামলা করেছেন, বলেছেন হিংসাত্মক চিত্রগুলি তার পিটিএসডি করেছে। "দ্য মডারেটর" শিরোনামে একটি দুর্দান্ত ডকুমেন্টারি যা এই ব্যক্তির কিছু ব্যক্তির জীবন দেখায়:

এমনকি ফেসবুকের সমস্ত লোহা ironেকে দেওয়া ব্যবস্থা সহ এখনও "অমানবিক" কাজের অনুশীলনের কারণে আইনী প্রক্রিয়াগুলির ঝুঁকির সংস্পর্শে রয়েছে। একই নিউ ইয়র্ক টাইমসের নিবন্ধের একটি অংশ:

গত বছর দ্য গার্ডিয়ানকে বলেছিলেন যে, "নাম প্রকাশে অনিচ্ছুক রয়েছেন, কিন্তু মামলায় উদ্ধৃত হয়েছেন এমন এক ব্যক্তি," আপনি প্রতি সকালে সকাল ৯ টায় কাজে যাবেন, আপনার কম্পিউটারটি চালু করুন এবং কারও মাথা কেটে দেখুন। “প্রতিদিন, প্রতি মিনিটে, আপনি যা দেখেন তা হ'ল। মাথা কেটে ফেলা হচ্ছে। ”

এটি একটি কঠিন কাজ।

সঠিকতা

সুস্পষ্ট গাইডলাইন প্রতিষ্ঠা করা সত্ত্বেও, মানব মডারেটররা এখনও ত্রুটিগুলির ঝুঁকিতে পড়তে পারে কারণ উচ্চ ভলিউম পরিচালনা করতে এবং তাদের নির্ধারিত এসএলএ পূরণের জন্য তারা দ্রুত কাজ করার আশা করছেন। আমরা ভারতে যে এজেন্সিটির সাথে কথা বলেছি তার একজন মডারেটর দ্রুত স্কিম করে প্রতি মিনিটে 10-15 <1 মিনিটের ভিডিওগুলি মাঝারিভাবে মাঝারি হতে পারে বলে আশা করা যায়।

তারা বিশেষত প্রান্তের ক্ষেত্রে লড়াই করে এবং প্রচুর মিথ্যা ইতিবাচক প্রতিশ্রুতি দেয়। অর্থাত্ পর্নাকে কল করে যা নয়। এটি বাকস্বাধীনতার প্রতিবন্ধকতা শেষ করতে পারে যেগুলির মধ্যে কয়েকটি প্ল্যাটফর্ম দাঁড়িয়েছে এবং দ্বিগুণ মানের কারণে ব্যবহারকারীরা বিদ্রোহ করতে পারে।

সূত্র: দ্য মাইক

সংক্ষিপ্তসার হিসাবে, মানব মডারেটররা হলেন:

  • অনিবার্য, এখনকার হিসাবে, বিষয়বস্তুর বিষয়গত প্রকৃতির কারণে
  • ব্যয়বহুল, বিশেষত আপনি স্কেল হিসাবে
  • আঘাতজনিত প্রবণ
  • ত্রুটির প্রবণতা, বিশেষত যখন ভলিউম বেশি এবং প্রান্তের ক্ষেত্রে থাকে

সুতরাং আপনার মডারেটররা সন্তোষজনকভাবে পারফর্ম করছে কিনা তা ট্র্যাক করা সত্যিই গুরুত্বপূর্ণ হয়ে ওঠে।

মডারেটরের পারফরম্যান্স ট্র্যাক করার মেট্রিক্স

আপনার স্বতন্ত্র মডারেটররা কীভাবে সম্পাদন করছে তা দেখার জন্য সাধারণত আপনার এই ম্যাট্রিকগুলি ট্র্যাক করা উচিত, যদিও আপনি আপনার ব্যবসায়ের প্রয়োজনীয়তার ভিত্তিতে বিভিন্ন মেট্রিক গ্রহণ করতে পারেন। মেট্রিকগুলি কৃত্রিম বুদ্ধিমত্তা থেকে অনুপ্রাণিত হয় এবং দুটি জিনিসকে চাপ দেয় যা সবচেয়ে বেশি ক্ষতি করতে পারে:

মিথ্যা ইতিবাচক

এমন কিছুকে "পর্ন" বলা যা "অশ্লীল নয়"

মিথ্যা নেতিবাচক

“অশ্লীল নয়” বলে কল্পনা করা কিন্তু অশ্লীল (সবচেয়ে ব্যথা!)

সঠিকতা

চিত্রগুলি সঠিকভাবে চিহ্নিত (পর্ন পর্ন হচ্ছে, নিরাপদ নিরাপদ) No. আপনি অন ট্র্যাক রয়েছেন তা নিশ্চিত করতে আপনাকে আরও একটি স্বাস্থ্য মেট্রিক ট্র্যাক করতে হবে।

স্পষ্টতা

প্রকৃতপক্ষে পর্নযুক্ত চিহ্নিত পর্ন চিত্রগুলির সংখ্যা। উচ্চতর ভাল।

আপনার যদি এমন কোনও ব্যবসা থাকে যেখানে বাকস্বাধীনতা / মতপ্রকাশের স্বাধীনতা সমালোচনাযোগ্য (উদাহরণস্বরূপ Reddit), আপনাকে অবশ্যই নিশ্চিত করতে হবে যে নিয়ম মেনে চলতে থাকা কোনও চিত্রকে "নিরাপদ নয়" হিসাবে ট্যাগ করবেন না মডারেটররা ’t আপনার সবচেয়ে গুরুত্বপূর্ণ মেট্রিক তখন যথার্থতা।

প্রত্যাহার

মোট অশ্লীল চিত্রগুলিতে তারা কতজন সনাক্ত করেছে। উচ্চতর ভাল।

আপনার যদি এমন কোনও ব্যবসা থাকে যেখানে আপনার শ্রোতাদের, স্বাস্থ্যকর পরিবার-উপযোগী উপযুক্ত সামগ্রী দেখার প্রয়োজন হয় তবে আপনাকে অবশ্যই নিশ্চিত করতে হবে যে কোনও চিত্র যা নিয়ম অনুসরণ করছে না তা আপনার ফিল্টারগুলি পাস করে না। আপনার সবচেয়ে গুরুত্বপূর্ণ মেট্রিক এরপরে রিকাল।

F-1 স্কোর

যথার্থতা এবং পুনরুদ্ধার উভয় সহ আরও একটি পুষ্টিকর মেট্রিক। উচ্চতর ভাল।

আপনার যদি বাকস্বাধীনতার প্রতিবন্ধকতা না সৃষ্টি এবং কঠোর বিধি নিষেধ না করা উভয়ের মধ্যে মিডলাইন হওয়া প্রয়োজন তবে F1 স্কোরটি ট্র্যাক করার জন্য আপনার মেট্রিক।

আপনি কীভাবে তাদের গণনা করবেন তা এখানে রয়েছে:

পরিভাষা আরও ভালভাবে বুঝতে আপনাকে সহায়তা করার জন্য এখানে একটি ফ্লোচার্ট রয়েছে:

প্রতিটি মডারেটরের প্রতিদিনের কাজের একটি এলোমেলো% নমুনা পর্যালোচনা করে এবং মানদণ্ডগুলি সেট করে, আপনি তাদের কার্য সম্পাদনের উপর নজর রাখতে পারেন।

এছাড়াও আমরা লক্ষ্য করেছি যে বাতিল করা পোস্ট (গোর, পরামর্শমূলক নগ্নতা, স্পষ্ট স্পষ্ট নগ্নতা, ড্রাগস ইত্যাদি) এর উপ-বিভাগে ট্যাগ করা এবং এই বিভাগগুলির মধ্যে মেট্রিকগুলি ট্র্যাক করা আপনার ভবিষ্যতের প্রশিক্ষণ কর্মসূচির পরিকল্পনার ক্ষেত্রে অনেক বেশি অন্তর্দৃষ্টিযুক্ত।

কৃত্রিম বুদ্ধি ব্যবহার করে

বাজারে একাধিক বাণিজ্যিক API রয়েছে যা এনএসএফডাব্লু সামগ্রী সনাক্ত করে।

গভীর নিউরাল নেটওয়ার্ক ব্যবহার করে, এই এপিআইগুলি প্রাথমিকভাবে নগ্নতা, পর্নোগ্রাফি (যৌন ক্রিয়াকলাপ) এবং গোর সনাক্ত করতে কোনও ব্যবহারকারী প্ল্যাটফর্মে নিয়মিত সামগ্রীকে মেশিন লার্নিং সরবরাহ করে। একটি এপিআই বাছাই করার সময় উত্তর দেওয়ার মূল প্রশ্নগুলি হ'ল:

এটা কত টাকা লাগে? প্রতিক্রিয়া সময় কি? আপনি তাদের কর্মক্ষমতা মূল্যায়নের জন্য কোন মেট্রিক ব্যবহার করেন? সেটআপ এবং ইন্টিগ্রেশন সময় কি?

আমরা নিম্নলিখিত API গুলি তুলনা করেছি:

নারী-সৈনিক
Clarifai
DeepAI
গুগল
মাইক্রোসফট
Nudedetect
Nanonets
Picpurify
Sightengine

মূল্য

প্রতি ইমেজ এ তাদের কত খরচ হয়েছে:

ন্যানোনেটসের মূল্য সর্বনিম্ন $ 0.0009 / ইমেজ এবং অ্যামাজন এবং মাইক্রোসফ্টের পরে $ 0.001 / চিত্র হয়।

এটি প্লট করা:

পিপিআই প্রতি মূল্য নির্ধারণ করা হচ্ছে

চিত্র প্রতি গড় মূল্য pr 00 0.001 প্রকাশিত হয়

এটির সাথে মানুষের মডারেটরের সুলভ মূল্যের সাথে তুলনা করা যা $ 0.01। মানব মডারেটরগুলির এআই এপিআই সরবরাহকারীদের দাম 10x! গ্রাফের মাধ্যমে এটি ভিজ্যুয়ালাইজ করা:

ছন্দোবিজ্ঞান

মূল্যায়নের মেট্রিকগুলি মানব মডারেটরগুলির মতো একই থাকে: নির্ভুলতা, যথার্থতা, পুনর্বিবেচনা এবং F1। একটি দুর্দান্ত নিবন্ধ রয়েছে যা এই মেট্রিকগুলির পাশাপাশি 2018 এর সেরা এনএসএফডাব্লু চিত্র সংযোজন APIগুলির তুলনা দেয়।

সেটআপ এবং একীকরণ

এই এপিআইয়ের বেশিরভাগই ওয়েব-হোস্ট করা এবং সহজেই ইন্টিগ্রেটেড।

এগুলির কাছে সাধারণত কয়েকটি লাইন কোড থাকে যা আপনার ইমেজ ইউআরএল বা বাইটস (কাঁচা ফাইল) সংহত করতে এবং পাস করতে হবে need

Nanonets আপনার মডেলটির জন্য একটি ডকার চিত্র তৈরি এবং এটি আপনার সার্ভারে হোস্ট করার একটি অতিরিক্ত সুবিধা সরবরাহ করে।

সুডো এনভিডিয়া-ডকার রান-পি 8081: 8080 ডকার.নোনোনটস // মডেল_আইডি}}: জিপিইউ

ডকার পাত্রে মডেলটি চালানোর জন্য কোডের একটি নমুনা লাইন।

প্রতিক্রিয়া সময়

বেশিরভাগ এপিআই 200-20000 মিলিসেকেন্ডের প্রতিক্রিয়া সময় প্রতিশ্রুতি দেয়। এটিতে আপনার সার্ভারগুলির মধ্যে ভ্রমণের সময় অন্তর্ভুক্ত নয় এবং আপনি যে চিত্রটি জমা দিচ্ছেন তার আকারের ভিত্তিতেও এটি পরিবর্তিত হতে পারে। সুতরাং আপনার সম্ভবত আপনার সরবরাহকারীর কাছে দ্রুত প্রতিক্রিয়ার সময়ের জন্য আপনার অঞ্চলে একটি সার্ভার রয়েছে বা কেবল ন্যানোনেটসের ডকার পরিষেবাটি ব্যবহার করা উচিত এবং এটি স্থানটিতে স্থাপন করা উচিত।

এটি ওয়েবপুরাইফের হিউম্যান মডারেশন সার্ভিসের সাথে তুলনা করুন যা <2 মিনিটের প্রতিক্রিয়া সময়ের প্রতিশ্রুতি দেয়। এটি API এর তুলনায় প্রতিক্রিয়া সময় 10x!

এটির সংক্ষিপ্তসার হিসাবে, মানব মডারেটরের তুলনায় মেশিন লার্নিং ভিত্তিক এপিআইগুলি হ'ল:

  • সস্তা
  • দ্রুত
  • স্কেল করা সহজ
  • যন্ত্রগুলি ট্রমার মুখোমুখি হয় না (!)

সুতরাং সব মিলিয়ে মেশিনগুলি অবশ্যই মানুষের চেয়ে কাজের জন্য অনেক বেশি উপযুক্ত।

তাহলে কেন আমাদের এখনও মানুষের মডারেটর দরকার?

ঠিক আছে, এর উত্তর হ'ল মেশিনগুলি সাবজেক্টিভিটি পরিচালনা করতে এখনও উপযুক্ত নয় এবং সহজেই ট্রিক করা যায়।

  1. বর্ণগত পক্ষপাত

নিম্নলিখিত চিত্রটি বিবেচনা করুন:

আপনি এখানে মূল চিত্রটি দেখতে পারেন। সতর্কতা: এটি সুস্পষ্ট

আমরা উপরে উল্লিখিত 2 টি পরিষেবাদি সহ উপরের চিত্রটি চেষ্টা করেছি:

Clarifai

ক্লারিফাই 91% আত্মবিশ্বাসের সাথে এটিকে এসএফডাব্লু হিসাবে ভুলভাবে শ্রেণিবদ্ধ করছেন

Picpurify

পিকপুরিফাই এটিকে এসএফডাব্লু হিসাবে ভুলভাবে শ্রেণিবদ্ধ করে

তাহলে এখানে কী হয়েছে? মহিলার কাপড়ের নিদর্শনগুলি এবং প্রকৃতির দৃশ্যগুলি নিউরাল নেটওয়ার্কগুলিকে বিভ্রান্ত করেছে এবং তারা ছবিটি এনএসএফডাব্লু হিসাবে শ্রেণিবদ্ধ করতে অক্ষম হয়েছে বা সম্পূর্ণ আলাদা ভবিষ্যদ্বাণী দিয়েছে।

Traditionalতিহ্যবাহী কিমনোতে নগ্ন জাপানি মহিলাদের প্রশিক্ষণের ডেটা না থাকা এই এপিআইগুলির জন্য এই ধরণের পক্ষপাত তৈরি করতে পারে, যা বেশিরভাগ মার্কিন যুক্তরাষ্ট্র এবং ইউরোপের বাইরে রয়েছে এবং তাদের অঞ্চলে সংখ্যাগরিষ্ঠ জাতিগোষ্ঠীর ব্যক্তিদের ছবিতে তাদের নেটওয়ার্ক প্রশিক্ষণ দেয়। সুতরাং যদি এই অঞ্চলগুলি বাদ দিয়ে আপনার ব্যবহারকারী থাকে এবং আপনি স্থানীয় পর্ন (বা অন্যান্য আপত্তিকর সামগ্রী) আপলোড করছেন তবে বেশিরভাগ ব্যবহারের জন্য প্রস্তুত এপিআই এখানে খুব বেশি সহায়ক নাও হতে পারে।

2. সামাজিক প্রসঙ্গ

উপরে যেমন অন্বেষণ করা হয়েছে, 1 অঞ্চলে যা ঠিক আছে তা অন্য জায়গায় উপহাস করা যেতে পারে। যেহেতু এআই এপিআইয়ের বেশিরভাগ সরবরাহকারী পশ্চিমা অঞ্চলগুলির বাইরে ভিত্তিক, তাই তারা সাধারণত বিশ্বের আরও রক্ষণশীল অংশগুলিতে সুরক্ষিত নয়। সুতরাং এনএসএফডাব্লু কীসের প্রশ্নটি আপনার, আপনার ব্যবহারকারী ডেমোগ্রাফিক এবং আপনি যে অঞ্চলগুলিতে পরিচালনা করছেন সেগুলির পক্ষে খুব সুনির্দিষ্ট a স্পষ্টতই একটি ব্যবহারের জন্য প্রস্তুত এপিআই এর উত্তর নয় এবং তাই মানব মডারেটরের প্রয়োজনীয়তা।

ইরান ও সৌদি আরবের বিনয়ী আইন মেনে চলতে আরিয়ানা গ্র্যান্ডের কভার আর্ট ফটোশপ করা হয়েছে (উত্স: পেটপিক্সেল)

৩. একটি আকার সব মাপসই করে না

বেশিরভাগ এপিআই সরবরাহকারীরা চিত্রটি গ্রহণযোগ্য কিনা তা একটি স্কোর দেয় বা অতিরিক্তভাবে তাদের পূর্বনির্ধারিত মেটা-ট্যাগগুলি অনুযায়ী ট্যাগ করতে পারে। আমাজন নীচে এটির চিত্রগুলি ট্যাগ করে:

এই বিভাগগুলির মধ্যে পড়ে যে কুলুঙ্গিটি আপনি পরিবেশন করেন তার উপর ভিত্তি করে এখন আপনার নিজের কিছু ট্যাগ তৈরি করতে পারে। এটি করার কোনও বিকল্প আপনার কাছে নেই। ট্যাগিং (যা সুপারিশের মূল অংশ) আজ বেশিরভাগ সামাজিক ইউজিসি অ্যাপ্লিকেশনগুলির রুটি এবং মাখন এবং যদি ব্যবহারের জন্য প্রস্তুত এপিআইগুলির কোনও ব্যবহার করে, আপনি প্রাক-নির্ধারিত ট্যাগগুলির সাথে আটকে যাবেন।

কীভাবে মানব মডারেটরের উপর নির্ভরতা হ্রাস করা যায়

অবিচ্ছিন্ন ফাঁকগুলি সনাক্ত করতে আপনার মডেলগুলিকে ক্রমাগত পুনরায় প্রশিক্ষণ দেওয়া হ'ল মানব নির্ভরতা হ্রাস করার উপায়। পুনরায় প্রশিক্ষণের অর্থ হ'ল আপনার নির্দিষ্ট এনএসএফডাব্লু ডেটাসেট যুক্ত করা এবং এটি একটি বিদ্যমান বিদ্যমান মডেলের "শীর্ষে" প্রশিক্ষণ দেওয়া। এইভাবে মডেলটি আগে মিস করা জিনিসগুলি সনাক্ত করতে আরও ভাল হতে থাকে।

সুতরাং বলুন উদাহরণস্বরূপ আপনার প্ল্যাটফর্মে এমন চিত্র রয়েছে যা সেমেটিক বিরোধী প্রকৃতির এবং আপনি ঘৃণা-মুক্ত পরিবেশ নিশ্চিত করতে এগুলি নিষিদ্ধ করতে চান। আপনার নির্বাচিত এপিআই সরবরাহকারী এই জাতীয় চিত্রগুলি বর্তমানে ফিল্টার করে না এবং আপনি এই অ্যান্টি-সেমিটিক চিত্রগুলির একটি ডেটাসেট তৈরি করতে চান যা একটি আদর্শ প্যাটার্ন অনুসরণ করে। আপনি এই চিত্রগুলির একটি ডেটাসেট তৈরি করতে এবং প্রাক-বিদ্যমান মডেলটির শীর্ষে পুনরায় প্রশিক্ষণ দিতে পারেন যাতে এটি "অনিরাপদ" হিসাবে শ্রেণিবদ্ধকরণ শুরু করতে পারে।

তবে বেশিরভাগ এপিআই সরবরাহকারী আপনাকে তা করতে দেয় না বা এটি তাদের "এন্টারপ্রাইজ" স্তরটিতে অন্তর্ভুক্ত করা হয়েছে।

ন্যানোনেটস প্রবেশ করান

ন্যানোনেটস-এ আমরা এই নির্দিষ্ট সমস্যাটি উপলব্ধি করেছি এবং আপনার নিজস্ব চিত্রগুলি যুক্ত করতে এবং আমাদের অতিরিক্ত সামগ্রীর সংযোজন মডেলের উপরে আপনার অতিরিক্ত ট্যাগগুলি সংজ্ঞায়িত করার জন্য বৈশিষ্ট্যটি যুক্ত করেছি যাতে আপনি আপনার জন্য সামগ্রিক নির্ভুলতা উন্নত করতে পারেন।

App.nanonets.com এ আমাদের হোস্ট করা মডেলটির জন্য আপনার নির্ভুলতার উন্নতি করুন

ট্রান্সফার লার্নিং ব্যবহার করে, আমরা এমন একটি মডেল প্রশিক্ষণ দিই যা আপনার ডেটা থেকে শিখে এবং আপনার প্রয়োজনের সাথে খাপ খায়।

কেস স্টাডি: বৃহত্তম ভারতীয় সামাজিক নেটওয়ার্ক Network

সমস্যা

আমাদের 50M এরও বেশি মাসিক সক্রিয় ব্যবহারকারীদের সাথে ভারতের সবচেয়ে বড় স্থানীয় সামাজিক নেটওয়ার্ক ছিল আমাদের কাছে খুব নির্দিষ্ট সমস্যা নিয়ে আসে। তাদের নির্বাচিত এপিআই সরবরাহকারী ভারতীয় চিত্রগুলি প্রেরণে ত্রুটি করছিল। তাদের পূর্ববর্তী সরবরাহকারীর যথার্থতা এই জাতীয় চিত্রগুলিতে ~ 72% ছিল।

কেন তাদের বিদ্যমান সমাধান কাজ করছে না?

একটি এমএল মডেল যতটা ডেটা প্রকাশ করেছে সেই পরিমাণে তত ভাল। উপলব্ধ বর্তমানে প্রচলিত মডেলগুলির বেশিরভাগ জেনেরিক ডেটা সম্পর্কে প্রশিক্ষণ পেয়েছে। তারা গ্রামীণ ভারতের বাজেট স্মার্টফোনে নিম্নমানের ক্যামেরা ব্যবহার করে স্থানীয়ভাবে উত্পাদিত ব্যবহারকারী-উত্পাদিত-সামগ্রী সম্পর্কে ভবিষ্যদ্বাণী করতে ব্যর্থ হয়।

এই ছবিগুলি আপনার পছন্দের অনুসন্ধান ইঞ্জিনে বা কোনও প্রকাশ্যে উপলভ্য ডেটাসেটে পাবলিকভাবে উপলভ্য চিত্রগুলির চেয়ে সামগ্রী, ত্বকের রঙ, ক্যামেরা ইত্যাদির তুলনায় খুব আলাদা very

সমাধান:

আমরা ব্যবসায়িকদের তাদের প্রয়োজনীয় সংবেদনশীলতা স্তরের বিষয়ে জিজ্ঞাসা করি যা তারা পরিবেশন করে এমন ব্যবহারকারী ডেমোগ্রাফিক এবং প্রায় 10,000 চিত্র - ইতিবাচক এবং নেতিবাচক উভয় নমুনা।

আমরা আমাদের প্রাক-বিদ্যমান মডেলটিকে শীর্ষে নতুন মডেলকে প্রশিক্ষণ দিতে এই ডেটা ব্যবহার করেছি। এটি আমাদের সংবেদনশীলতার সূত্রপাত করতে এবং মডেলটিকে তাদের প্ল্যাটফর্মের নির্দিষ্ট সামগ্রীতে প্রকাশ করতে দেয়।

ফলাফল:

আমাদের কাছে এখন এমন একটি মডেল ছিল যার যথার্থতা 23% এরও বেশি বেড়েছে এবং লাফিয়ে 95% ডলারে চলে গেছে! সমস্যাটি বিবরণী ডেটা ভাগ করে নেওয়া এবং তারপরে অবশেষে একটি মডেল সরবরাহ করা থেকে পুরো ব্যায়াম শেষ থেকে শেষ পর্যন্ত 1 মাস সময় নেয়।

নির্ভুলতা 23% এর বেশি উন্নত হয়েছে এবং লাফিয়ে 95% ডলারে গেছে!

এনএসএফডাব্লু-র নির্দিষ্ট জনসংখ্যা এবং সংজ্ঞাগুলির জন্য আমাদের মডেলগুলি টিউন করার ক্ষমতা এটিকে আরও শক্তিশালী এবং এই সমস্যাটি মোকাবেলায় পারদর্শী হতে দেয়।