কৃত্রিম বুদ্ধিমত্তা (AI) মডেলের জেমিনি পরিবার পাঠ্য, ছবি এবং অডিও সহ বিভিন্ন ধরণের ইনপুট ডেটা পরিচালনা করার জন্য তৈরি করা হয়েছে৷ যেহেতু এই মডেলগুলি একাধিক প্রকার বা ডেটা মোড পরিচালনা করতে পারে, তাই মিথুন মডেলগুলিকে মাল্টিমোডাল মডেল বলা হয় বা মাল্টিমডাল ক্ষমতা রয়েছে বলে ব্যাখ্যা করা হয়।
এই পৃষ্ঠাটি Gemini API-এর জন্য প্রম্পট সহ মিডিয়া ফাইলগুলি ব্যবহার করার জন্য নির্দেশিকা এবং সর্বোত্তম অনুশীলন প্রদান করে। মিডিয়া ফাইল আপলোড করার জন্য এবং আপনার প্রম্পটে সেগুলি অন্তর্ভুক্ত করার জন্য Gemini Files API ব্যবহার করার বিষয়ে তথ্যের জন্য, ভিশন , অডিও , এবং ডকুমেন্ট প্রসেসিং গাইড দেখুন৷
প্রম্পট সহ মিডিয়া ফাইল ব্যবহার করা
আপনার প্রম্পটে বিভিন্ন ধরণের ডেটা ব্যবহার করতে সক্ষম হওয়ার ফলে আপনি জেমিনি API এর সাথে কোন কাজগুলি মোকাবেলা করতে পারেন তার পরিপ্রেক্ষিতে আপনাকে আরও নমনীয়তা দেয়৷ উদাহরণস্বরূপ, আপনি মডেলটিকে একটি সুস্বাদু খাবারের একটি ফটো পাঠাতে পারেন এবং খাবার সম্পর্কে একটি ছোট ব্লগ লিখতে বলতে পারেন।
প্রম্পট | প্রতিক্রিয়া |
এই ছবির উপর ভিত্তি করে একটি ছোট, আকর্ষক ব্লগ পোস্ট লিখুন। এটি ফটোতে খাবারের একটি বিবরণ অন্তর্ভুক্ত করা উচিত এবং আমার ভ্রমণের খাবার প্রস্তুত করার বিষয়ে কথা বলা উচিত। | খাবার প্রস্তুত করা সময় এবং অর্থ সাশ্রয়ের একটি দুর্দান্ত উপায় এবং এটি আপনাকে স্বাস্থ্যকর খেতেও সহায়তা করতে পারে। এই খাবারটি একটি স্বাস্থ্যকর এবং সুস্বাদু খাবারের একটি দুর্দান্ত উদাহরণ যা সময়ের আগে সহজেই প্রস্তুত করা যেতে পারে। এই খাবারে বাদামী চাল, ভাজা সবজি এবং চিকেন তেরিয়াকি রয়েছে। বাদামী চাল একটি স্বাস্থ্যকর এবং জটিল কার্বোহাইড্রেট যা আপনাকে টেকসই শক্তি দেবে। রোস্ট করা শাকসবজি হল আপনার প্রতিদিনের ভিটামিন এবং মিনারেলের ডোজ পাওয়ার একটি দুর্দান্ত উপায় এবং চিকেন তেরিয়াকি একটি সুস্বাদু এবং প্রোটিন সমৃদ্ধ বিকল্প। এই খাবারটি প্রস্তুত করাও খুব সহজ। সহজভাবে বাদামী চাল রান্না করুন, সবজি ভাজুন এবং চিকেন তেরিয়াকি রান্না করুন। একবার সবকিছু রান্না হয়ে গেলে, খাবারের প্রস্তুতির পাত্রে ভাগ করে ফ্রিজে সংরক্ষণ করুন। তারপর আপনি একটি ধারক দখল এবং ব্যস্ত সকালে যেতে পারেন! আপনি যদি একটি স্বাস্থ্যকর এবং সুস্বাদু খাবার খুঁজছেন যা সহজেই সময়ের আগে প্রস্তুত করা যেতে পারে, এই খাবারটি একটি দুর্দান্ত বিকল্প। এটি পুষ্টি এবং গন্ধে পরিপূর্ণ, এবং এটি আপনাকে পূর্ণ এবং সন্তুষ্ট বোধ করবে তা নিশ্চিত। এখানে স্বাস্থ্যকর এবং সুস্বাদু খাবারের প্রস্তুতি রয়েছে! |
মিডিয়ার সাথে প্রম্পট করার কৌশল
মিডিয়া ফাইলগুলি ব্যবহার করে এমন প্রম্পটগুলি থেকে আপনি যে আউটপুটটি চান তা পেতে যদি আপনার সমস্যা হয় তবে কিছু কৌশল রয়েছে যা আপনাকে আপনার পছন্দের ফলাফল পেতে সহায়তা করতে পারে। নিম্নলিখিত বিভাগগুলি মাল্টিমোডাল ইনপুট ব্যবহার করে এমন প্রম্পটগুলিকে উন্নত করার জন্য নকশা পদ্ধতি এবং সমস্যা সমাধানের টিপস প্রদান করে।
আপনি এই সেরা অনুশীলনগুলি অনুসরণ করে আপনার মাল্টিমোডাল প্রম্পটগুলিকে উন্নত করতে পারেন:
প্রম্পট নকশা মৌলিক
- আপনার নির্দেশাবলীতে সুনির্দিষ্ট হোন : পরিষ্কার এবং সংক্ষিপ্ত নির্দেশনা তৈরি করুন যা ভুল ব্যাখ্যার জন্য ন্যূনতম জায়গা ছেড়ে দেয়।
- আপনার প্রম্পটে কয়েকটি উদাহরণ যোগ করুন: আপনি কী অর্জন করতে চান তা বোঝাতে বাস্তবসম্মত কয়েকটি শট উদাহরণ ব্যবহার করুন।
- ধাপে ধাপে এটি ভেঙে ফেলুন : জটিল কাজগুলিকে পরিচালনাযোগ্য উপ-লক্ষ্যে বিভক্ত করুন, প্রক্রিয়াটির মাধ্যমে মডেলটিকে গাইড করুন।
- আউটপুট ফরম্যাটটি নির্দিষ্ট করুন : আপনার প্রম্পটে, মার্কডাউন, JSON, এইচটিএমএল এবং আরও অনেক কিছুর মতো আউটপুট আপনার পছন্দ মতো ফর্ম্যাটে হতে বলুন।
- সিঙ্গেল-ইমেজ প্রম্পটের জন্য আপনার ইমেজকে প্রথমে রাখুন : যদিও মিথুন যেকোন ক্রমে ইমেজ এবং টেক্সট ইনপুটগুলি পরিচালনা করতে পারে, একটি একক ইমেজ সম্বলিত প্রম্পটের জন্য, যদি সেই ইমেজটি টেক্সট প্রম্পটের আগে স্থাপন করা হয় তাহলে এটি আরও ভাল পারফর্ম করতে পারে।
আপনার মাল্টিমোডাল প্রম্পটের সমস্যা সমাধান করা হচ্ছে
- যদি মডেলটি ছবির প্রাসঙ্গিক অংশ থেকে তথ্য আঁকতে না পারে: ইমেজটির কোন দিক দিয়ে আপনি প্রম্পটটি থেকে তথ্য আঁকতে চান তা নির্দেশ করুন।
- যদি মডেলের আউটপুট খুব জেনেরিক হয় (ছবির জন্য যথেষ্ট উপযুক্ত নয়): প্রম্পটের শুরুতে, টাস্ক নির্দেশনা দেওয়ার আগে মডেলটিকে চিত্র(গুলি) বর্ণনা করতে বলার চেষ্টা করুন, অথবা মডেলটিকে যা আছে তা উল্লেখ করতে বলার চেষ্টা করুন ছবিটি
প্রম্পট নকশা মৌলিক
এই বিভাগটি পূর্ববর্তী বিভাগে তালিকাভুক্ত সেরা অনুশীলনগুলির উপর প্রসারিত হয়।
দ্রষ্টব্য: নিম্নলিখিত মিথুন উদাহরণ থেকে মডেল ফলাফল রান থেকে রান পরিবর্তিত হতে পারে।
আপনার নির্দেশাবলী সুনির্দিষ্ট হন
প্রম্পটগুলি সবচেয়ে সফল হয় যখন সেগুলি পরিষ্কার এবং বিস্তারিত হয়। আপনার মনে একটি নির্দিষ্ট আউটপুট থাকলে, আপনি যে আউটপুট চান তা নিশ্চিত করতে প্রম্পটে সেই প্রয়োজনীয়তাটি অন্তর্ভুক্ত করা ভাল।
কখনও কখনও, একটি প্রম্পটের অভিপ্রায় সেই ব্যক্তির কাছে স্পষ্ট মনে হতে পারে যিনি এটি লিখেছেন, কিন্তু এটি আসলে কম-নির্দিষ্ট। মডেল আচরণ কাস্টমাইজ করতে, আপনার প্রম্পটকে কীভাবে ব্যাখ্যা করা যেতে পারে (ভুল) তা বিবেচনা করুন এবং নিশ্চিত করুন যে আপনার দেওয়া নির্দেশাবলী সুনির্দিষ্ট এবং স্পষ্ট। ভুল ব্যাখ্যার জন্য ন্যূনতম জায়গা ছেড়ে দিতে ভুলবেন না
একটি বিমানবন্দর বোর্ডের এই চিত্রটির জন্য, মডেলটিকে শুধুমাত্র "এই চিত্রটি বর্ণনা করতে" বলা একটি সাধারণ বিবরণ তৈরি করতে পারে৷ আপনার যদি চিত্র থেকে সময় এবং শহর বিশ্লেষণ করার জন্য মডেলটির প্রয়োজন হয়, আপনি সরাসরি আপনার প্রম্পটে সেই অনুরোধটি অন্তর্ভুক্ত করতে পারেন।
প্রম্পট | মডেল প্রতিক্রিয়া |
---|---|
এই চিত্রটি বর্ণনা করুন। | ছবিটি বিমানবন্দরে আগমন এবং প্রস্থান বোর্ড দেখায়। |
আপডেট করা প্রম্পট | উন্নত প্রতিক্রিয়া |
---|---|
একটি তালিকায় এই ছবিতে দেখানো বিমানবন্দর বোর্ড থেকে সময় এবং শহর পার্স করুন। |
কয়েকটি উদাহরণ যোগ করুন
জেমিনি মডেল একাধিক ইনপুট গ্রহণ করতে পারে যা এটি আপনার পছন্দের আউটপুট বোঝার জন্য উদাহরণ হিসাবে ব্যবহার করতে পারে। এই উদাহরণগুলি যোগ করা মডেলটিকে নিদর্শনগুলি সনাক্ত করতে এবং প্রদত্ত চিত্র এবং নতুন উদাহরণের প্রতিক্রিয়াগুলির মধ্যে সম্পর্ক প্রয়োগ করতে সহায়তা করতে পারে। এটিকে "কয়েক-শট" শেখারও বলা হয়।
নীচের উদাহরণে, প্রাথমিক আউটপুট বাক্য আকারে লেখা হয়েছে এবং এতে দেশ (ব্রাজিল)ও রয়েছে। ধরুন আপনি একটি ভিন্ন বিন্যাস বা শৈলীতে আউটপুট চান, এবং আপনি শুধুমাত্র শহর চান, দেশ নয়। আপনার প্রম্পটে কয়েকটি শট উদাহরণ যোগ করলে মডেলটিকে আপনি যেভাবে চান সেভাবে সাড়া দিতে পারে।
প্রম্পট | মডেল প্রতিক্রিয়া |
---|---|
ল্যান্ডমার্ক সহ শহর নির্ধারণ করুন। | ল্যান্ডমার্ক হল ব্রাজিলের রিও ডি জেনিরোতে ক্রাইস্ট দ্য রিডিমার মূর্তি। |
আপডেট করা প্রম্পট | উন্নত প্রতিক্রিয়া |
---|---|
ল্যান্ডমার্ক সহ শহর নির্ধারণ করুন। | শহর: রোম, ল্যান্ডমার্ক: কলোসিয়াম। |
শহর: বেইজিং, ল্যান্ডমার্ক: নিষিদ্ধ শহর | |
শহর: রিও ডি জেনিরো, ল্যান্ডমার্ক: ক্রাইস্ট দ্য রিডিমার মূর্তি |
ধাপে ধাপে এটি ভেঙে ফেলুন
জটিল কাজগুলির জন্য যেগুলির জন্য চাক্ষুষ বোঝার এবং যুক্তি উভয়েরই প্রয়োজন, কাজটিকে আরও ছোট, আরও সরল ধাপে ভাগ করা সহায়ক হতে পারে। বিকল্পভাবে, এটি কার্যকর হতে পারে যদি আপনি সরাসরি মডেলটিকে আপনার প্রম্পটে "ধাপে ধাপে চিন্তা করতে" বলেন।
প্রম্পট | মডেল প্রতিক্রিয়া |
---|---|
কখন আমার টয়লেট পেপার ফুরিয়ে যাবে? | শীঘ্রই, আপনার কাছে মাত্র 3টি রোল বাকি আছে। |
আপডেট করা প্রম্পট | উন্নত প্রতিক্রিয়া |
---|---|
|
|
গণিত সমস্যা বা অন্যান্য ধরণের শব্দ সমস্যাগুলি মডেলকে ধাপে ধাপে চিন্তা করতে বলার জন্য দুর্দান্ত প্রার্থী।
প্রম্পট | প্রতিক্রিয়া |
---|---|
অনুক্রমের ৪র্থ পদ কি? | -135 |
মডেল থেকে প্রতিক্রিয়া ভুল. এটি উন্নত করার কিছু উপায় হল প্রম্পটের উত্তর দেওয়ার আগে মডেলটিকে সমস্যাটি পার্স করতে বলা।
প্রম্পট | প্রতিক্রিয়া |
---|---|
প্রথমে ছবিতে সূত্রটি পার্স করুন। তারপর সূত্রের উপর ভিত্তি করে, উত্তর দিন "ক্রমের 4র্থ পদটি কী?"। | $$ b(n) = b(n-1) * (-3) $$ $$ b(1) = 15 $$ $$ b(4) = b(4-1) * (-3) $$ $$ b(4) = b(3) * (-3) $$ $$ b(3) = b(3-1) * (-3) $$ $$ b(3) = b(2) * (-3) $$ $$ b(2) = b(2-1) * (-3) $$ $$ b(2) = b(1) * (-3) $$ $$ b(2) = 15 * (-3) $$ $$ b(2) = -45 $$ $$ b(3) = b(2) * (-3) $$ $$ b(3) = -45 * (-3) $$ $$ b(3) = 135 $$ $$ b(4) = b(3) * (-3) $$ $$ b(4) = 135 * (-3) $$ $$ b(4) = -405 $$ অতএব, অনুক্রমের 4র্থ পদটি হল -405। |
এই মডেলের প্রতিক্রিয়াটি সঠিক - এখন প্রতিক্রিয়াটিকে আরও সুগম করতে, আপনি মডেলটিকে ধাপে ধাপে চিন্তা করতে বলতে পারেন৷
আপডেট করা প্রম্পট | উন্নত প্রতিক্রিয়া |
---|---|
অনুক্রমের ৪র্থ পদ কি? ধাপে ধাপে চিন্তা করুন। | প্রথম মেয়াদ 15। দ্বিতীয় পদটি হল b(1) * (-3) = 15 * (-3) = -45। তৃতীয় পদটি হল b(2) * (-3) = -45 * (-3) = 135। চতুর্থ পদটি হল b(3) * (-3) = 135 * (-3) = -405। |
আউটপুট বিন্যাস নির্দিষ্ট করার চেষ্টা করুন
একটি সাধারণ সমস্যা হল মডেল আউটপুট একটি নির্দিষ্ট বিন্যাসে (যেমন মার্কডাউন, JSON, এইচটিএমএল) হওয়া প্রয়োজন, বিশেষ করে যদি মডেল আউটপুটটি একটি ডাউনস্ট্রিম টাস্ক দ্বারা ইনজেস্ট করা প্রয়োজন। আপনি মডেলটিকে প্রম্পটের মধ্যে এটি করার নির্দেশ দিয়ে সেই বিন্যাসে আউটপুট তৈরি করার চেষ্টা করতে পারেন। নীচে দুটি উদাহরণ দেওয়া হল:
প্রম্পট | মডেল প্রতিক্রিয়া |
---|---|
মার্কডাউন বিন্যাসে এই চিত্রের টেবিলটি পার্স করুন | | বিষয় | স্ট্যাটাস | সময় | শুরুর তারিখ | বাকি আছে | | ------- | ------ | ---- | --------- | ------ | | গণিত | সম্পন্ন | 1.5 ঘন্টা | 11/29/2023 | 12/1/2023 | | ভূগোল | সম্পন্ন | 30 মিনিট | 12/2/2023 | 12/4/2023 | | পদার্থবিদ্যা | চলছে | 2 ঘন্টা | 12/3/2023 | 12/5/2023 | | জীববিদ্যা | শুরু হয়নি | 6 ঘন্টা | 11/2/2016 | 12/6/2023 | |
প্রম্পট | মডেল প্রতিক্রিয়া |
---|---|
নিম্নলিখিত সমস্ত বৈশিষ্ট্যগুলির একটি তালিকা প্রদান করুন: উপাদান, রান্নার ধরন, নিরামিষ বা না, JSON ফর্ম্যাটে | ``জসন`` { "উপাদান": [ "ভাত", "চিংড়ি", "ক্ল্যামস", "ঝিনুক", "মটর" "টমেটো", "পেঁয়াজ", "রসুন", "জলপাই তেল", "পাপরিকা", "লবণ", "মরিচ" ], "রোজগারের প্রকার": "স্প্যানিশ", "নিরামিষাশী": মিথ্যা |
একক-ইমেজ প্রম্পটগুলির জন্য আপনার ছবিটি প্রথমে রাখুন
যদিও মিথুন একটি প্রম্পটের মধ্যে যেকোনো ক্রমে ছবি এবং পাঠ্যকে ব্যাখ্যা করতে পারে, টেক্সট প্রম্পটের আগে একটি একক ছবি রাখলে ভালো ফলাফল হতে পারে। নিম্নলিখিত নমুনাগুলিতে, আপনি লক্ষ্য করবেন প্রতিটি প্রম্পটে পাঠ্যের আগে চিত্রটি প্রথমে আসে।
আপনার মাল্টিমোডাল প্রম্পটের সমস্যা সমাধান করা হচ্ছে
আপনি একটি সহায়ক প্রতিক্রিয়া না পেলে আপনার প্রম্পটের সমস্যা সমাধানের প্রয়োজন হতে পারে। এখানে কয়েকটি কৌশল রয়েছে যা আপনি চেষ্টা করতে পারেন।
যদি মডেলটি ছবির প্রাসঙ্গিক অংশ থেকে তথ্য আঁকতে না পারে
আরও সুনির্দিষ্ট প্রতিক্রিয়া পেতে, আপনি নির্দেশ করতে পারেন যে চিত্রটির প্রতিক্রিয়া জানাতে আপনি প্রম্পট থেকে তথ্য আঁকতে চান তার কোন দিকগুলি।
প্রম্পট | মডেল প্রতিক্রিয়া |
---|---|
কত দিন এই ডায়াপার একটি শিশুর চলবে? | ডায়াপার ফুরিয়ে যাওয়ার আগে 198 দিন ধরে চলবে। |
আপডেট করা প্রম্পট | উন্নত প্রতিক্রিয়া |
---|---|
আমি ফুরিয়ে যাবার আগে এই ডায়াপারগুলো কতক্ষণ চলবে? বাচ্চার বয়স নির্ধারণ করতে বাক্সে দেখানো ওজন ব্যবহার করুন এবং বাক্সে মোট ডায়াপারের সংখ্যা ব্যবহার করুন। শিশু প্রতিদিন কতগুলি ডায়াপারের মধ্য দিয়ে যায় তার দ্বারা মোট সংখ্যাকে ভাগ করুন। | বাক্সে 198টি ডায়াপার রয়েছে। বাক্সে বলা হয়েছে যে ডায়াপারগুলি 22-37 পাউন্ড ওজনের একটি শিশুর জন্য। এই ওজন সীমার মধ্যে গড় শিশুর বয়স সম্ভবত 1 থেকে 2 বছরের মধ্যে। একজন 2 বছর বয়সী সাধারণত প্রতিদিন 6 টি ডায়াপারের মধ্য দিয়ে যায়, তাই, ডায়াপার প্রায় 33 দিন (198/6) স্থায়ী হয়। |
যদি মডেলের আউটপুট খুব জেনেরিক হয় এবং ইমেজ ইনপুটের জন্য যথেষ্ট উপযোগী না হয়
মডেলটিকে চিত্র(গুলি) এর প্রতি তার প্রতিক্রিয়া তৈরি করতে সাহায্য করার জন্য, এটির যুক্তির কাজটি সম্পাদন করার আগে চিত্রগুলি বর্ণনা করতে বলার চেষ্টা করুন৷
প্রম্পট | মডেল প্রতিক্রিয়া |
---|---|
এই ইমেজ মধ্যে সাধারণ কি? | চারটি ছবিই ল্যান্ডস্কেপ ফটোগ্রাফির উদাহরণ। |
আপডেট করা প্রম্পট | উন্নত প্রতিক্রিয়া |
---|---|
প্রথমে, প্রতিটি ছবিতে কী আছে তা বিস্তারিতভাবে বর্ণনা করুন। এই ইমেজ মধ্যে সাধারণ কি? | প্রথম ছবিতে দেখা যাচ্ছে একজন ব্যক্তি একটি স্যুটকেস প্যাক করছেন৷ দ্বিতীয় ছবিটি একটি শপিং মলে একটি খালি হলওয়ে দেখায়। তৃতীয় ছবিটি টয়লেট পেপারের একটি রোল দেখায়। চতুর্থ চিত্রটি একটি অন্ধকার এবং ঝড়ো সমুদ্র দেখায়। এই চিত্রগুলির মধ্যে সাধারণতা হল যে এগুলি সমস্ত সীমাবদ্ধ স্থানগুলির উদাহরণ৷ লিমিনাল স্পেসগুলি এমন স্থান বা পরিস্থিতি যা দুটি অন্য স্থান বা পরিস্থিতির মধ্যে থাকে। এগুলি প্রায়শই অনিশ্চয়তা বা অস্পষ্টতার অনুভূতি দ্বারা চিহ্নিত করা হয়। প্রথম চিত্রটি বাড়িতে থাকা এবং ভ্রমণে থাকা মাঝখানে ব্যক্তিটিকে দেখায়৷ দ্বিতীয় ছবিটি দুটি দোকানের মধ্যে হলওয়ে দেখায়। তৃতীয় ছবিটি টয়লেট পেপারের, যা একটি বাথরুমের প্রতিনিধিত্ব করতে পারে। একটি বাথরুম ব্যক্তিগত এবং পাবলিক অঞ্চলের মধ্যে একটি ক্রান্তিকালীন স্থান। এটি এমন একটি জায়গা যেখানে আমরা বাইরের জগতে প্রবেশ বা ছেড়ে যাওয়ার জন্য নিজেদের প্রস্তুত করি। চতুর্থ চিত্রটি শান্ত এবং ঝড়ো হওয়ার মধ্যে সমুদ্র দেখায়। লিমিনাল স্পেসগুলি উত্তেজনাপূর্ণ এবং অস্থির উভয়ই হতে পারে। এগুলি নতুন শুরুর জায়গা বা শেষের জায়গা হতে পারে। তারা প্রতিফলনের জায়গা বা কর্মের জায়গা হতে পারে। |
এছাড়াও আপনি ছবিতে যা আছে তা উল্লেখ করতে মডেলটিকে স্পষ্টভাবে বলার চেষ্টা করতে পারেন।
আপডেট করা প্রম্পট | উন্নত প্রতিক্রিয়া |
---|---|
এই ইমেজ মধ্যে সাধারণ কি? আপনার প্রতিক্রিয়াতে চিত্রগুলিতে কী আছে তা পড়ুন। | সব ছবিই ভ্রমণ সম্পর্কিত। প্রথম চিত্রটিতে একজন ব্যক্তিকে একটি স্যুটকেস প্যাক করছেন, দ্বিতীয় চিত্রটি একটি শপিং মলে একটি খালি হলওয়ে দেখায়, তৃতীয় চিত্রটি টয়লেট পেপারের স্তুপ দেখায় এবং চতুর্থ চিত্রটি একটি অন্ধকার এবং ঝড়ো সমুদ্র দেখায়৷ এই চিত্রগুলি সমস্ত ভ্রমণের সাথে সম্পর্কিত কারণ এগুলি এমন সমস্ত জিনিস যা লোকেরা ভ্রমণের সময় প্রয়োজন বা ব্যবহার করে৷ প্রথম ছবিতে দেখা যাচ্ছে একজন ব্যক্তি একটি স্যুটকেস প্যাক করছেন, যেটি এমন কিছু যা তারা যখন ভ্রমণে যায় তখন তারা করে। দ্বিতীয় চিত্রটি একটি শপিং মলের একটি খালি হলওয়ে দেখায়, এটি এমন একটি জায়গা যেখানে লোকেরা প্রায়শই তাদের ভ্রমণের জন্য জিনিস কিনতে যায়। তৃতীয় চিত্রটি টয়লেট পেপারের একটি স্তুপ দেখায়, যা এমন কিছু যা লোকেরা প্রায়শই ভ্রমণ করার সময় ব্যবহার করে। চতুর্থ চিত্রটি একটি অন্ধকার এবং ঝড়ো সমুদ্র দেখায়, যা এমন কিছু যা লোকেরা প্রায়ই ভ্রমণ করার সময় সম্মুখীন হয়। |
একই টিপস ইমেজ থেকে সৃজনশীল আউটপুট জন্য কাজ করে. খরগোশের সাথে নিম্নলিখিত উদাহরণে, মডেলটিকে স্পষ্টভাবে চিত্রের দিকগুলি অন্তর্ভুক্ত করতে বলা আউটপুটকে উন্নত করতে পারে।
প্রম্পট | মডেল প্রতিক্রিয়া |
---|---|
আপনি কি আমাকে এই ছবিটি সম্পর্কে একটি কবিতা লিখতে পারেন? | ছোট খরগোশ, এত নরম এবং বাদামী, তুমি ঘাসের উপর চটকাও, এত সবুজ এবং মিষ্টি, |
আপডেট করা প্রম্পট | উন্নত প্রতিক্রিয়া |
---|---|
আপনি কি আমাকে এই চিত্র সম্পর্কে একটি বর্ণনামূলক এবং নাটকীয় কবিতা লিখতে পারেন এবং অবস্থান অন্তর্ভুক্ত করতে পারেন? | সবুজের উপর ছোট খরগোশ, এটা কি সাগর নীল, ছোট খরগোশ, সত্যি করে বলো, সম্ভবত এটি সমস্ত কিছুর বিশালতা, ছোট খরগোশ, আমি ভাবছি তুমি কি স্বপ্ন দেখো, যাই হোক না কেন, ছোট খরগোশ, |
প্রম্পটের কোন অংশ ব্যর্থ হয়েছে তার সমস্যা সমাধান করা হচ্ছে
একটি প্রম্পট ব্যর্থ হয়েছে কিনা তা জানা কঠিন হতে পারে কারণ মডেলটি যে ছবিটি দিয়ে শুরু করতে হবে তা বুঝতে পারেনি, অথবা যদি এটি চিত্রটি বুঝতে পারে তবে পরে সঠিক যুক্তি পদক্ষেপগুলি সম্পাদন করেনি।
এই কারণগুলির মধ্যে দ্ব্যর্থতা জানাতে, ছবিতে কী আছে তা বর্ণনা করতে মডেলটিকে বলুন৷
নীচের এই উদাহরণে, যদি মডেলটি চা (যেমন পপকর্ন) এর সাথে জুড়ি দেওয়ার সময় আশ্চর্যজনক বলে মনে হয় এমন একটি স্ন্যাক দিয়ে প্রতিক্রিয়া জানায়, তাহলে আপনি প্রথমে সমস্যা সমাধান করতে পারেন যে মডেলটি সঠিকভাবে চিনতে পেরেছে যে ছবিতে চা রয়েছে।
প্রম্পট | সমস্যা সমাধানের জন্য অনুরোধ করুন |
---|---|
আমি 1 মিনিটের মধ্যে কি একটি জলখাবার তৈরি করতে পারি যা এটির সাথে ভাল হবে? | এই ছবিতে কি আছে তা বর্ণনা করুন। |
আরেকটি কৌশল হল মডেলকে তার যুক্তি ব্যাখ্যা করতে বলা। এটি আপনাকে যুক্তির কোন অংশটি ভেঙেছে তা সংকুচিত করতে সাহায্য করতে পারে, যদি থাকে।
প্রম্পট | সমস্যা সমাধানের জন্য অনুরোধ করুন |
---|---|
আমি 1 মিনিটের মধ্যে কি একটি জলখাবার তৈরি করতে পারি যা এটির সাথে ভাল হবে? | আমি 1 মিনিটের মধ্যে কি একটি জলখাবার তৈরি করতে পারি যা এটির সাথে ভাল হবে? কেন ব্যাখ্যা করুন. |
নমুনা পরামিতি টিউনিং
প্রতিটি অনুরোধে, আপনি শুধুমাত্র মাল্টিমোডাল প্রম্পটই পাঠান না কিন্তু মডেলটিতে স্যাম্পলিং প্যারামিটারের একটি সেট পাঠান। মডেল বিভিন্ন পরামিতি মান জন্য বিভিন্ন ফলাফল তৈরি করতে পারে. কাজের জন্য সেরা মান পেতে বিভিন্ন পরামিতি নিয়ে পরীক্ষা করুন। সবচেয়ে সাধারণভাবে সামঞ্জস্য করা পরামিতিগুলি হল:
- তাপমাত্রা
- শীর্ষ-পি
- শীর্ষ-কে
তাপমাত্রা
রেসপন্স জেনারেশনের সময় নমুনা নেওয়ার জন্য তাপমাত্রা ব্যবহার করা হয়, যেটা ঘটে যখন টপ-পি এবং টপ-কে প্রয়োগ করা হয়। তাপমাত্রা টোকেন নির্বাচনে এলোমেলোতার মাত্রা নিয়ন্ত্রণ করে। নিম্ন তাপমাত্রা প্রম্পটগুলির জন্য ভাল যেগুলির জন্য আরও নির্ধারক এবং কম খোলামেলা বা সৃজনশীল প্রতিক্রিয়া প্রয়োজন, যখন উচ্চ তাপমাত্রা আরও বৈচিত্র্যময় বা সৃজনশীল ফলাফলের দিকে নিয়ে যেতে পারে। 0 এর তাপমাত্রা নির্ধারক, যার অর্থ সর্বোচ্চ সম্ভাব্য প্রতিক্রিয়া সর্বদা নির্বাচিত হয়।
বেশিরভাগ ব্যবহারের ক্ষেত্রে, 0.4 তাপমাত্রা দিয়ে শুরু করার চেষ্টা করুন। আপনার যদি আরও সৃজনশীল ফলাফলের প্রয়োজন হয় তবে তাপমাত্রা বাড়ানোর চেষ্টা করুন। আপনি যদি স্পষ্ট হ্যালুসিনেশন লক্ষ্য করেন, তাহলে তাপমাত্রা কমানোর চেষ্টা করুন।
টপ-কে
Top-K পরিবর্তন করে কিভাবে মডেল আউটপুটের জন্য টোকেন নির্বাচন করে। 1-এর একটি শীর্ষ-কে মানে পরবর্তী নির্বাচিত টোকেনটি মডেলের শব্দভান্ডারের সমস্ত টোকেনের মধ্যে সবচেয়ে সম্ভাব্য (যাকে লোভনীয় ডিকোডিংও বলা হয়), যখন 3-এর শীর্ষ-কে মানে হল যে তিনটি সম্ভাব্য টোকেনের মধ্যে থেকে পরবর্তী টোকেনটি নির্বাচন করা হয়েছে। তাপমাত্রা ব্যবহার করে।
প্রতিটি টোকেন নির্বাচন ধাপের জন্য, সর্বোচ্চ সম্ভাবনা সহ শীর্ষ-কে টোকেনগুলি নমুনা করা হয়৷ তারপর তাপমাত্রা নমুনা ব্যবহার করে নির্বাচিত চূড়ান্ত টোকেন সহ টপ-পি-এর উপর ভিত্তি করে টোকেনগুলি আরও ফিল্টার করা হয়।
কম এলোমেলো প্রতিক্রিয়াগুলির জন্য একটি নিম্ন মান এবং আরও র্যান্ডম প্রতিক্রিয়াগুলির জন্য একটি উচ্চ মান নির্দিষ্ট করুন৷ top-K এর ডিফল্ট মান হল 32।
টপ-পি
Top-P পরিবর্তন করে কিভাবে মডেল আউটপুটের জন্য টোকেন নির্বাচন করে। টোকেনগুলি সর্বাধিক (টপ-কে দেখুন) থেকে কম সম্ভাব্য থেকে নির্বাচন করা হয় যতক্ষণ না তাদের সম্ভাব্যতার যোগফল শীর্ষ-পি মানের সমান হয়। উদাহরণস্বরূপ, যদি A, B, এবং C টোকেনগুলির সম্ভাবনা 0.6, 0.3, 0.1 এবং শীর্ষ-P মান 0.9 হয়, তাহলে মডেলটি তাপমাত্রা ব্যবহার করে পরবর্তী টোকেন হিসাবে A বা B নির্বাচন করবে এবং একটি হিসাবে C বাদ দেবে প্রার্থী
কম এলোমেলো প্রতিক্রিয়াগুলির জন্য একটি নিম্ন মান এবং আরও র্যান্ডম প্রতিক্রিয়াগুলির জন্য একটি উচ্চ মান নির্দিষ্ট করুন৷ top-P এর ডিফল্ট মান হল 1.0।
পরবর্তী পদক্ষেপ
- Google AI Studio ব্যবহার করে আপনার নিজস্ব মাল্টিমোডাল প্রম্পট লেখার চেষ্টা করুন।
- প্রম্পট ডিজাইনের বিষয়ে আরও নির্দেশনার জন্য, প্রম্পট কৌশল পৃষ্ঠাটি দেখুন।
অন্য কিছু উল্লেখ না করা থাকলে, এই পৃষ্ঠার কন্টেন্ট Creative Commons Attribution 4.0 License-এর অধীনে এবং কোডের নমুনাগুলি Apache 2.0 License-এর অধীনে লাইসেন্স প্রাপ্ত। আরও জানতে, Google Developers সাইট নীতি দেখুন। Java হল Oracle এবং/অথবা তার অ্যাফিলিয়েট সংস্থার রেজিস্টার্ড ট্রেডমার্ক।
2024-08-22 UTC-তে শেষবার আপডেট করা হয়েছে।