
যদি আপনি একটি স্থাপন করার কথা ভাবছেন রাস্পবেরি পাই সহ এআই সহকারীআপনি সঠিক জায়গায় আছেন: আজ, রাস্পবেরি পাই ৪ এবং আরও শক্তিশালী রাস্পবেরি পাই ৫-এর ক্ষেত্রে এই ছোট SBC-গুলিতে ভয়েস, ভিশন এবং ল্যাঙ্গুয়েজ মডেলের সংমিশ্রণ ইতিমধ্যেই কার্যকর। বাস্তব প্রকল্পগুলি এটি প্রদর্শন করে, এবং এমন অফিসিয়াল আনুষাঙ্গিকও রয়েছে যা AI ত্বরণকে আরও এক ধাপ এগিয়ে নিয়ে যায়।
এই প্রবন্ধে আপনি একটি সম্পূর্ণ ওভারভিউ পাবেন: Pi 4 এবং এর মতো সরঞ্জামগুলির উপর ভিত্তি করে একটি ভয়েস-অ্যাক্টিভেটেড হোম অ্যাসিস্ট্যান্ট থেকে VOSK এবং ওল্লামা...Qwen3:1.7bo এবং Gemma3:1b এর মতো কমপ্যাক্ট মডেলগুলির সাথে ওয়েক ওয়ার্ড, ট্রান্সক্রিপশন এবং স্থানীয় অনুমান চালানোর জন্য একটি Pi 5 পর্যন্ত। আপনি আরও দেখতে পাবেন যে Hailo-8L NPU সহ AI কিটটি Pi 5-এর সাথে কীভাবে ফিট করে, স্বীকৃতি এবং TTS-এর জন্য কোন লাইব্রেরি ব্যবহার করতে হবে এবং কেন বাড়িতে এবং কর্মক্ষেত্রে নিরাপত্তাকে অগ্রাধিকার দেওয়া অত্যন্ত গুরুত্বপূর্ণ।
রাস্পবেরি পাই দিয়ে কেন একটি এআই সহকারী তৈরি করবেন?
রাস্পবেরি পাই-তে একটি স্মার্ট সহকারী আপনাকে কম খরচে এবং ন্যূনতম বিদ্যুৎ খরচে ডিভাইস নিয়ন্ত্রণ করতে, প্রশ্নের উত্তর দিতে এবং রুটিন স্বয়ংক্রিয় করতে দেয়; অন্য কথায়, এটি একটি আদর্শ প্ল্যাটফর্ম শিখুন, প্রোটোটাইপ করুন এবং স্থাপন করুন ক্লাউডের উপর নির্ভর না করেই ভয়েস এবং ভাষা ফাংশন।
রাস্পবেরি পাই দিয়ে আপনি মাইক্রোফোন, ক্যামেরা এবং ছোট স্ক্রিন, পাশাপাশি পাইথন, জাভা, অথবা সি++-এ প্রোগ্রাম একীভূত করতে পারবেন; এটি একটি ভয়েস-অ্যাক্টিভেটেড স্ট্যাটাস প্যানেল থেকে শুরু করে ফেসিয়াল রিকগনিশন সহ একটি অ্যাক্সেস কন্ট্রোল সিস্টেম, এমনকি একটি হোম বট পর্যন্ত প্রকল্পের দরজা খুলে দেয় যা শুনুন, ব্যাখ্যা করুন এবং কাজ করুন তোমার আদেশ অনুসারে।
রাস্পবেরি পাই ৪ বনাম রাস্পবেরি পাই ৫: শক্তি এবং সম্ভাবনা
রাস্পবেরি পাই ৪ দেখিয়েছে যে সঠিক স্ট্যাক বেছে নিলে স্থানীয় ভয়েস সহকারী সম্ভব; তবে, রাস্পবেরি পাই ৫ কেবল সিপিইউ এবং জিপিইউকে ত্বরান্বিত করে না, বরং উচ্চ-কার্যক্ষমতা সম্পন্ন আনুষাঙ্গিকগুলির জন্য পিসিআই সংযোগও যোগ করে এবং পোর্ট এবং ব্যান্ডউইথ উন্নত করে, তাই সামগ্রিক অভিজ্ঞতা আরও নির্বিঘ্ন হয়ে ওঠে.
পাই ৫ এর স্পেসিফিকেশনের মধ্যে, এর অসাধারণ বৈশিষ্ট্যগুলির মধ্যে রয়েছে ২.৪ গিগাহার্টজ পর্যন্ত একটি ARM কর্টেক্স-A76 প্রসেসর, ৮ গিগাবাইট পর্যন্ত LPDDR4X র্যাম, ওয়াই-ফাই ৫, ব্লুটুথ ৫.০/BLE এবং ৬০ হার্জে ৪K আউটপুট সহ ডুয়াল মাইক্রো-এইচডিএমআই পোর্ট। সেন্সরের একটি শক্তিশালী সেটের সাথে মিলিত হয়ে, এটি সহকারীকে একই সাথে কাজগুলি নির্বিঘ্নে পরিচালনা করতে এবং বজায় রাখতে সহায়তা করে। কম বিলম্ব কণ্ঠস্বরের মিথস্ক্রিয়ায়।
ASRAI: Pi 4 এর সাথে একটি বাস্তব প্রকল্প যা গোপনীয়তা এবং নিয়ন্ত্রণের উপর দৃষ্টি নিবদ্ধ করে
একজন দক্ষ নির্মাতা ASRAI তৈরি করেছেন, যা একটি ভয়েস-অ্যাক্টিভেটেড সহকারী যা Raspberry Pi 4 মডেল B এর উপর ভিত্তি করে তৈরি, যার একটি 3,5-ইঞ্চি GPIO ডিসপ্লে এবং একটি Sony PlayStation Eye ক্যামেরা রয়েছে। আসল রত্ন হল PlayStation Eye: এতে একটি চার-মাইক্রোফোন অ্যারে রয়েছে যা Pi এর জন্য সহজেই আলাদা করা যায় এবং সেকেন্ডহ্যান্ড বাজারে, এটি প্রায় বিনামূল্যে পাওয়া যায়, যা এটিকে একটি আসল দর কষাকষিতে পরিণত করে। অডিও ক্যাপচারের জন্য দর কষাকষি মৌলিক রশ্মি গঠন সহ।
এই প্রকল্পে, Pi 4 অফলাইনে স্পিচ রিকগনিশনের জন্য স্থানীয়ভাবে VOSK চালায় এবং Ollama-এর মাধ্যমে একটি OpenAI-সামঞ্জস্যপূর্ণ API পয়েন্টের মাধ্যমে লেখকের নিজস্ব পিসিতে হোস্ট করা LLM-এর সাথে নেটওয়ার্কের মাধ্যমে সংযোগ স্থাপন করে। যেকোনো জায়গা থেকে এই সংযোগটি কাজ করার জন্য, নির্মাতা NordVPN-এর Meshnet সক্ষম করেছেন, এইভাবে একটি ব্যক্তিগত এবং সর্বব্যাপী লিঙ্ক ইন্টারনেটে সরাসরি পরিষেবাগুলি প্রকাশ না করেই।
ধারণাটি হল ক্যাপচার, ওয়েক ওয়ার্ড এবং স্থানীয় ট্রান্সক্রিপশনটি পাইতে ডাউনলোড করা ভস, যখন ভাষা তৈরি অন্য মেশিনে একটি আরও শক্তিশালী মডেল দ্বারা পরিচালিত হয় যা OpenAI-টাইপ API ব্যবহার করে যা দ্বারা প্রকাশিত হয় ওল্লামা এবং Meshnet-এর মাধ্যমে সহজলভ্য; এইভাবে, কর্মক্ষমতা এবং গোপনীয়তা ভারসাম্যপূর্ণ।
"মানবিক" স্পর্শের জন্য, প্রকল্পটিতে ছোট পর্দায় ঘুমানোর বা শোনার জন্য ছবি অন্তর্ভুক্ত করা হয়েছে। যদি আপনি এটির প্রতিলিপি তৈরি করতে আগ্রহী হন, তাহলে নির্মাতা প্রয়োজনীয় সংস্থানগুলি ভাগ করে নেবেন এবং এটি থাকা সহায়ক... থ্রিডি প্রিন্টার এবং একটি ওয়েল্ডার মাইক্রোফোন অ্যারের সমাবেশ এবং সমন্বয়ের জন্য।
এই উদ্যোগটি বিশেষায়িত মিডিয়া দ্বারা তুলে ধরা হয়েছিল এবং এটি নকশা দর্শনে অন্যান্য Rhaspy-সদৃশ পদ্ধতির স্মরণ করিয়ে দেয়: স্থানীয় স্বীকৃতি এবং মডুলার অর্কেস্ট্রেশন। এমনকি ঘনিষ্ঠ সহযোগীদের কথাও উল্লেখ করা হয়েছে যারা তাদের Pi কে রূপান্তরিত করেছিলেন এআই সহকারী এবং রাস্পবেরি পাই ৫-এ বিভিন্ন এআই-এর কর্মক্ষমতা বিশ্লেষণ করে প্রজন্মের অগ্রগতির কথা ভাবছেন এমন ব্যক্তিদের নির্দেশনা দিয়েছেন।
রাস্পবেরি পাই ৫ এর জন্য অফিসিয়াল এআই কিট: ত্বরণের দ্রুততম পথ
যদি আপনি এটিকে পরবর্তী স্তরে নিয়ে যেতে চান, তাহলে Raspberry Pi 5 এর জন্য AI কিটটি একটি Hailo-8L NPU যোগ করে যা একটি পূর্বে ইনস্টল করা M.2 2242 এর উপরে যুক্ত করে যা M.2 HAT+ এর সাথে সংযুক্ত। এই সংমিশ্রণটি দক্ষ প্রান্ত অনুমানের জন্য 13 টি পর্যন্ত TOPS প্রদান করে, CPU কে তীব্র কাজের চাপ থেকে মুক্ত করে এবং সহকারীকে ভিশন বা অডিও মডেলগুলি চালানোর অনুমতি দেয় কম বিলম্ব এবং খরচ.
প্যাকেজটি সম্পূর্ণরূপে আসে: একটি স্ট্যাকেবল GPIO হেডার, স্পেসার, স্ক্রু, Pi 5 এর PCIe বাসের সাথে AI বোর্ড সংযোগ করার জন্য একটি নমনীয় রিবন কেবল এবং তাপমাত্রা নিয়ন্ত্রণে রাখার জন্য একটি উপযুক্ত হিটসিঙ্ক। ভৌত ইনস্টলেশন সহজ, এবং তারপরে সফ্টওয়্যারটি স্থাপন করা হয়। রাস্পবেরি পাই অপারেটিং সিস্টেমে উপযুক্ত.
- Hailo‑8L NPU সহ Hailo AI মডিউল
- রাস্পবেরি পাই ৫ এর জন্য রাস্পবেরি পাই এম.২ হ্যাট+
- মডিউল এবং HAT+ এর মধ্যে আগে থেকে ইনস্টল করা থার্মাল প্যাড
- স্পেসার এবং স্ক্রু সহ মাউন্টিং কিট
- স্ট্যাকেবল ১৬ মিমি জিপিআইও সংযোগকারী এবং ফ্ল্যাট পিসিআই কেবল
রাস্পবেরি পাই ওএস পরিবেশে হাইলো ডিভাইসের একীকরণ পরিপক্ক: এটি এর সাথে কাজ করে libcamera, rpicam-apps এবং picamera2 এবং সফটওয়্যার ইকোসিস্টেম (Hailo, HailoRT, এবং HailoTappas ড্রাইভার) সরাসরি প্যাকেজ ম্যানেজারের মাধ্যমে ইনস্টল করা হয়। এইভাবে, একটি কম্পিউটার ভিশন অ্যাসিস্ট্যান্টের (যেমন, মুখ বা অঙ্গভঙ্গি সনাক্তকরণ) ভিত্তি প্রস্তুত। ন্যূনতম ঘর্ষণ.
ব্যবহারের ক্ষেত্রে: হোম কন্ট্রোল থেকে কথোপকথন সহকারী পর্যন্ত
একটি Pi 5 এবং AI কিট দিয়ে আপনি ফেসিয়াল রিকগনিশন অ্যাক্সেস কন্ট্রোল সিস্টেম থেকে শুরু করে যেকোনো কিছু সেট আপ করতে পারবেন কথোপকথনমূলক গৃহ সহকারী "হ্যান্ডস-ফ্রি।" একটি সাধারণ রোবট যার মৌলিক নেভিগেশন রয়েছে যা ভয়েস কমান্ড গ্রহণ করে এবং সাড়া দেয় বক্তৃতা সংশ্লেষ লাউডস্পিকারের মাধ্যমে।
যদি আপনি অ্যাক্সিলারেটর না চান, তাহলে ASRAI (স্থানীয় স্পিচ প্রসেসিং এবং রিমোট LLM) এর মতো একটি হাইব্রিড পদ্ধতি অথবা সর্বশেষ কম্প্যাক্ট মডেল সহ একটি পূর্ণ-স্থানীয় পদ্ধতিও কার্যকর। একটি নিরবচ্ছিন্ন অভিজ্ঞতা নিশ্চিত করার জন্য মডেলের আকার, কোয়ান্টাইজেশন এবং অডিও পাইপলাইনকে সূক্ষ্মভাবে সুরক্ষিত করাই মূল বিষয়। চটপটে এবং স্থিতিশীল উপলব্ধ হার্ডওয়্যারের উপর।
রাস্পবেরি পাইতে ভয়েস এবং ভাষার জন্য মূল সফ্টওয়্যার
অফলাইন স্পিচ রিকগনিশনের জন্য, VOSK হল Raspberry Pi-তে একটি নিরাপদ বাজি। PocketSphinx-এর মতো বিকল্পগুলিও কার্যকর, এবং যদি আপনি ক্লাউড পরিষেবা পছন্দ করেন, তাহলে Google স্পিচ রিকগনিশনের মতো ইঞ্জিনগুলির সাথে ইন্টিগ্রেশন রয়েছে; তবে অনেক প্রকল্প অগ্রাধিকার দেয় গোপনীয়তা এবং কম বিলম্বিতাতাই স্থানীয় প্রতিলিপিটি স্থল লাভ করে।
স্থানীয় বক্তৃতা সংশ্লেষণের জন্য, pyttsx3 বাহ্যিক নির্ভরতা ছাড়াই একটি মৌলিক TTS প্রদান করে। LLM উপাদান সম্পর্কে, Ollama একটি "OpenAI সামঞ্জস্যপূর্ণ" এন্ডপয়েন্ট দিয়ে পরিবেশন মডেলগুলিকে সহজ করে তোলে, যা কাস্টম স্ক্রিপ্ট বা বিদ্যমান ক্লায়েন্টদের সাথে সংযোগ স্থাপন করা সহজ করে তোলে। এই পদ্ধতির সাহায্যে, আপনার Pi পাইপলাইনটি সাজাতে পারে এবং একটি [নির্দিষ্ট অ্যাপ্লিকেশন/টুল - প্রসঙ্গ প্রয়োজন]-এ প্রজন্মকে অর্পণ করতে পারে। সবচেয়ে শক্তিশালী দল.
একটি ১০০% পাই ৫ মিনি-এজেন্ট: ওয়েক ওয়ার্ড, ট্রান্সক্রিপশন এবং স্থানীয় অনুমান
একজন উৎসাহী দেখিয়েছেন যে ১৬ গিগাবাইট র্যাম সহ একটি রাস্পবেরি পাই ৫ পুরো চক্রটি চালাতে পারে: VOSK দিয়ে শব্দ সনাক্তকরণ ট্রিগার করা, দ্রুত-হুইস্পার দিয়ে ট্রান্সক্রিপশন করা এবং Gemma3:1b দ্বারা Qwen3:1.7 এর মতো কমপ্যাক্ট LLM দিয়ে অনুমান করা, সবই স্থানীয়ভাবে। এটি একটি অপ্টিমাইজেশন চ্যালেঞ্জ, তবে এটি করা যেতে পারে; এটি নথিভুক্ত করার জন্য সংগ্রহস্থল এবং ব্লগ পোস্ট একটি দুর্দান্ত সম্পদ। শেখার জন্য আমার সূক্ষ্ম সমন্বয় এবং সম্পদ ব্যবস্থাপনার উপর।
এই উদাহরণ থেকে শিক্ষাটি স্পষ্ট: সুনির্বাচিত মডেল, কোয়ান্টাইজেশন এবং একটি সুবিন্যস্ত পাইপলাইনের সাহায্যে, Pi 5 যুক্তিসঙ্গত সময়ের সাথে সাড়া দেয়। যদি প্রকল্পটির জন্য আরও প্রক্রিয়াকরণ শক্তির প্রয়োজন হয়, তাহলে উপলব্ধি কাজের জন্য (দৃষ্টি, অডিও) Hailo-8L ব্যবহার করার এবং একটি হালকা স্থানীয় LLM বজায় রাখার অথবা একটি রিমোট সার্ভার উপযুক্ত.
শুরু করা: অপারেটিং সিস্টেম, লাইব্রেরি এবং প্রকল্প কাঠামো
রিসোর্স সর্বাধিক করার জন্য, অনেক ডেভেলপার তার লাইট ভেরিয়েন্টে রাস্পবিয়ান (রাস্পবেরি পাই ওএস) সুপারিশ করেন, যা পরিষেবা এবং বেস মেমোরির ব্যবহার হ্রাস করে। সেখান থেকে, আপনার প্রয়োজনীয় স্পিচ, টিটিএস এবং অর্কেস্ট্রেশন লাইব্রেরিগুলি ইনস্টল করুন; পাইথনের সাহায্যে, একটি কার্যকরী এবং স্কেলেবল প্রোটোটাইপ তৈরি করা সহজ। ভালোভাবে আলাদা করা মডিউল.
জন্য একটি রেসিপি বুট স্বাভাবিকের মধ্যে রয়েছে:
- রাস্পবেরি পাই ওএস লাইট ইনস্টল করুন এবং সিস্টেম আপডেট প্রয়োগ করুন।
- অডিও (মাইক্রোফোন এবং স্পিকার), প্রযোজ্য হলে ক্যামেরা কনফিগার করুন এবং রেকর্ড/এপ্লে দিয়ে পরীক্ষা করুন।
- প্যাকেজ ইনস্টল করুন যেমন কন্ঠ সনান্তকরণ (যদি আপনি ক্লাউড পরিষেবা ব্যবহার করতে চান) অথবা অফলাইনে VOSK/PocketSphinx ব্যবহার করতে চান, এবং pyttsx3 স্থানীয় TTS এর জন্য।
- আপনার LLM ব্যাকএন্ড বেছে নিন: ওলামা এবং ছোট মডেল সহ স্থানীয়, অথবা সামঞ্জস্যপূর্ণ রিমোট।
- পাইথনে প্রধান লুপ কোড করুন: শুনুন, প্রতিলিপি করুন, ব্যাখ্যা করুন (NLP), এবং ক্রিয়া সম্পাদন করুন।
NLP স্তরে, আপনি সহজ উদ্দেশ্য এবং নিয়ম দিয়ে শুরু করতে পারেন, এবং অগ্রগতির সাথে সাথে LLM অন্তর্ভুক্ত করতে পারেন। কমান্ড কার্যকর করার জন্য, প্রতিটি ডিভাইস বা পরিষেবার জন্য অ্যাডাপ্টার সংজ্ঞায়িত করুন (উদাহরণস্বরূপ, আলো, জলবায়ু নিয়ন্ত্রণ, অনুস্মারক), যাতে সহকারী একটি পরিষ্কার এবং প্রসারণযোগ্য কোর.
সংযোগ এবং অর্কেস্ট্রেশন: একটি ভালো নেটওয়ার্কের সাথে সবকিছুই একসাথে খাপ খায়।
পাই-তে Wi-Fi 5 এবং Bluetooth 5.0/BLE রয়েছে, তাই এটি লাইট বাল্ব, স্পিকার এবং সেন্সরের সাথে তারবিহীনভাবে যোগাযোগ করতে পারে। যখন বহিরাগত পরিষেবা বা একাধিক মেশিন জড়িত থাকে, তখন NordVPN-এর Meshnet-এর মতো একটি ব্যক্তিগত নেটওয়ার্ক ফ্যাব্রিক পোর্টগুলিকে বিশ্বের সামনে প্রকাশ না করেই একটি অফ-সাইট মডেল সার্ভার "দেখা" করার Pi-এর ক্ষমতাকে সহজ করে তোলে, বজায় রাখে নিয়ন্ত্রণ এবং নিরাপত্তা.
যদি আপনি বিভিন্ন পরিবেশে উইজার্ড স্থাপনের পরিকল্পনা করেন, তাহলে ইনফারেন্স কম্পোনেন্ট বা মাল্টিমিডিয়া পাইপলাইনের জন্য কন্টেইনার বিবেচনা করুন। পৃথক পরিষেবা (ASR, TTS, LLM, অর্কেস্ট্রেটর) সহ একটি কাঠামো আপনাকে কম্পোনেন্ট স্কেল করতে এবং ওয়ার্কলোড অন্য নোডে স্থানান্তর করতে অনুমতি দেবে। ন্যূনতম প্রভাব বাকি সিস্টেমে।
নিরাপত্তা: পর্যবেক্ষণের জন্য সর্বোত্তম অনুশীলন এবং দুর্বলতা
একজন সহকারী সর্বদা তার চারপাশের কথা শোনে এবং অন্যান্য ডিভাইসের সাথে যোগাযোগ করে, তাই সাইবার নিরাপত্তা অত্যন্ত গুরুত্বপূর্ণ। পরিচিত শোষণ কমাতে সিস্টেম এবং লাইব্রেরিগুলিকে আপডেট রাখার মাধ্যমে শুরু করুন এবং ডিভাইসগুলির মধ্যে সমস্ত যোগাযোগের জন্য এনক্রিপশন সক্ষম করুন; বাড়ির বাকি অংশ থেকে IoT নেটওয়ার্ককে আলাদা করা একটি পরিমাপ। সস্তা এবং কার্যকর.
IoT এবং মিডলওয়্যার সম্পর্কে পরামর্শ পর্যালোচনা করা এবং জনসাধারণের দুর্বলতাগুলি যেমন নোট করা মূল্যবান CVE-2021-22945 o CVE-2021-22946 অন্যান্য জিনিসের মধ্যে, এগুলি নির্ভরতা নিরীক্ষণ এবং দ্রুত প্যাচ প্রয়োগ করার জন্য অনুস্মারক হিসেবে কাজ করে। লক্ষ্য হল আপনার সহকারী বোঝা না হয়ে সহায়ক হবে। একটি ঝুঁকি ভেক্টর.
ক্যামেরা এবং কম্পিউটার ভিশনের সাথে একীকরণ
যদি আপনার সহকারীর সাথে ক্যামেরা থাকে, তাহলে Pi 5 libcamera এবং rpicam-apps এর সাথে ভালোভাবে কাজ করে; এছাড়াও, picamera2 ভিডিও স্ট্রিমগুলিতে প্রোগ্রাম্যাটিক অ্যাক্সেস সহজতর করে। Hailo-8L এর সাহায্যে, বস্তু সনাক্তকরণ এবং মুখের স্বীকৃতির মতো কাজগুলি গতি এবং দক্ষতা অর্জন করে, যা পরিস্থিতিগুলিকে সক্ষম করে অ্যাক্সেস নিয়ন্ত্রণ অথবা প্রসঙ্গ-সংবেদনশীল হোম অটোমেশন।
একটি সাধারণ পদ্ধতি হল দৃষ্টিভঙ্গি Pi-তে রাখা এবং LLM-কে উচ্চ-স্তরের ব্যাখ্যা অর্পণ করা ("যদি আপনি X-কে চিনতে পারেন, তাহলে আমাকে জিজ্ঞাসা করুন আমার দরজা খোলা উচিত কিনা")। কাঁচা ছবি নয়, শুধুমাত্র মেটাডেটা বা ফলাফল ভাগ করে, আপনি গোপনীয়তা উন্নত করেন এবং ব্যান্ডউইথ প্রয়োজনীয়।
কার্যকরী ব্যবহারিক উদাহরণ
– পাই ৪-এ ASRAI: প্লেস্টেশন আই মাইক্রোফোন (৪টি মাইক্রোফোন), ৩.৫-ইঞ্চি GPIO ডিসপ্লে, স্থানীয় VOSK, ওল্লামার মাধ্যমে রিমোট LLM, এবং মেশনেটের সাথে যেকোনো জায়গায় সংযোগ। এর জন্য 3D প্রিন্টিং এবং সামান্য সোল্ডারিং প্রয়োজন, তবে ফলাফল হল একটি সহকারী চটপটে এবং বিচক্ষণ.
– পাই ৫ “অল-ইন-ওয়ান”: VOSK সহ ওয়েক ওয়ার্ড, ফাস্টার-হুইস্পার সহ ট্রান্সক্রিপশন এবং Gemma3:1b দ্বারা Qwen3:1.7 এর মাধ্যমে স্থানীয় অনুমান। মূল বিষয় হল যুক্তিসঙ্গত বিলম্ব বজায় রাখার জন্য মডেলগুলির আকার অপ্টিমাইজ করা এবং ক্যাপ করা; সংশ্লিষ্ট সংগ্রহস্থল হল একটি জীবন্ত পথপ্রদর্শক আপনার প্রকল্পটি সামঞ্জস্য করতে।
– AI কিট সহ Pi 5: অ্যাক্সেসের জন্য মুখের স্বীকৃতি, ত্বরিত দৃষ্টি মডেল সহ প্রাসঙ্গিক প্রতিক্রিয়া এবং কথোপকথনের জন্য একটি হালকা LLM; Hailo, HailoRT এবং HailoTappas ড্রাইভারগুলি apt এর মাধ্যমে ইনস্টল করা যায় এবং libcamera এবং picamera2 এর সাথে সামঞ্জস্যপূর্ণ যা ডিভাইসটিতেই সংহত করা হয়েছে। রাস্পবেরী পাই ওএস.
ভালো উন্নয়ন এবং রক্ষণাবেক্ষণের অনুশীলন
কোডটিকে মডিউলে গঠন করুন: অডিও ক্যাপচার, ASR, NLP, এক্সিকিউশন, TTS, এবং, যদি প্রযোজ্য হয়, ভিশন। বাধা সনাক্ত করতে দরকারী লগ এবং একটি ডিবাগ মোড যোগ করুন। যোগ করার সময় রিগ্রেশন ভাঙা এড়াতে মৌলিক পরীক্ষাগুলি (যেমন, পূর্বনির্ধারিত উদ্দেশ্য) স্বয়ংক্রিয় করুন। নতুন বৈশিষ্ট্য.
হার্ডওয়্যারের দিক থেকে, বিদ্যুৎ এবং বায়ুচলাচলের দিকে মনোযোগ দিন, বিশেষ করে যদি আপনি একটি NPU যোগ করেন বা ভারী লোড নিয়ে কাজ করেন। একটি ভাল হিটসিঙ্ক এবং শালীন বায়ুপ্রবাহ তাপীয় থ্রটলিং প্রতিরোধ করে এবং একটি স্থিতিশীল অভিজ্ঞতা বজায় রাখে। ক্রমাগত কথোপকথন.
সম্প্রদায় এবং নিয়ম: আপনার প্রকল্পগুলি সঠিকভাবে ভাগ করুন
যদি আপনি রাস্পবেরি পাই কমিউনিটিতে আপনার সহকারী প্রকাশ করতে চান, তাহলে মনে রাখবেন যে আপনি কীভাবে এটি করেছেন তা ব্যাখ্যা করা প্রশংসাযোগ্য, কেবল ফলাফল দেখানো নয়। স্প্যাম এবং যেকোনো আপত্তিজনক আচরণ এড়িয়ে চলুন, এবং অবশ্যই, কোনও অনিরাপদ বৈদ্যুতিক অনুশীলন এড়িয়ে চলুন; আরও শেখার পাশাপাশি, আপনি একটি স্বাস্থ্যকর পরিবেশ এবং সকলের জন্য উপকারী।
যখন আপনি শেয়ার করেন, তখন আপনার হার্ডওয়্যার, মূল ধাপ, নির্ভরতা, অডিও সেটিংস এবং ব্যবহৃত মডেলগুলি নথিভুক্ত করুন। এটি অন্যদের আপনার কাজ প্রতিলিপি করতে সাহায্য করে এবং মূল্যবান প্রতিক্রিয়া প্রদান করে; পরিশেষে, এই সহযোগিতা আপনার প্রকল্পকে অন্য যেকোনো পদ্ধতির চেয়ে বেশি ত্বরান্বিত করে। বিচ্ছিন্ন কৌশল.
পারফরম্যান্সে কী আশা করা যায় এবং আপনার স্থাপত্য কীভাবে সিদ্ধান্ত নেবেন
– যদি আপনি গোপনীয়তা এবং সম্পূর্ণ নিয়ন্ত্রণ খুঁজছেন, তাহলে স্থানীয় ASR এবং TTS, এবং Pi 5-এ একটি কমপ্যাক্ট LLM অথবা আপনার ব্যক্তিগত মেশনেট নেটওয়ার্কে Ollama দ্বারা পরিবেশিত একটি বিকল্প বেছে নিন। এইভাবে আপনি প্রথমেই কাজ করবেন এবং ভয়েস ডেটা সুরক্ষিত রাখবেন। তোমার ছাদের নিচে.
– যদি আপনার আরও সমৃদ্ধ উত্তরের প্রয়োজন হয় এবং ক্লাউড ব্যবহার করতে আপত্তি না থাকে, তাহলে রিমোট LLM বাধা দূর করে। এরপর Pi অর্কেস্ট্রেটিং ব্রেন হিসেবে কাজ করে, সেন্সর এবং অ্যাকচুয়েটর নিয়ন্ত্রণ করে এবং ভয়েস সেশন পরিচালনা করে গ্রহণযোগ্য বিলম্ব.
– যদি আপনার সহকারীর "দেখার" প্রয়োজন হয়, তাহলে Hailo-8L সহ AI কিটটি আপনার জন্য সেরা পছন্দ: এজ ভিশনের জন্য ১৩টি TOPS, apt এর মাধ্যমে ড্রাইভার এবং Raspberry Pi OS দ্বারা সমর্থিত একটি ইকোসিস্টেম। Pi এর বাইরে একটি মিড-রেঞ্জ LLM এর সাথে এটি একত্রিত করুন, এবং আপনার একটি দুর্দান্ত অভিজ্ঞতা হবে। গোলাকার এবং সুষম.
– যদি আপনি একটি পূর্ণ-স্থানীয় সেটআপ বেছে নেন, তাহলে অপ্টিমাইজ করা মডেলগুলি (Qwen3:1.7b, Gemma3:1b, অথবা সমতুল্য) বেছে নিন এবং অডিও রাউটিংয়ের দিকে মনোযোগ দিন; ট্রান্সক্রিপশনের জন্য Faster Whisper এবং ওয়েক ওয়ার্ড প্রসেসিংয়ের জন্য VOSK ব্যবহার ইতিমধ্যেই একটি কার্যকরী প্রমাণিত হয়েছে। কার্যকর পথ পাই ৫-এ ১৬ জিবি সহ।
পরিশেষে, রাস্পবেরি পাই দিয়ে একটি এআই সহকারী তৈরি করা সহজলভ্য উপাদানগুলিকে একত্রিত করে: পুনঃনির্ধারিত প্লেস্টেশন আইয়ের মতো সস্তা হার্ডওয়্যার, VOSK বা দ্রুত-হুইস্পারের মতো সফ্টওয়্যার, ওল্লামার মাধ্যমে ওপেনএআই-সামঞ্জস্যপূর্ণ এন্ডপয়েন্ট এবং প্রয়োজনে, পাই 5-এ হাইলো-8L এর অতিরিক্ত সুবিধা। সুরক্ষার দিকে মনোযোগ (আপডেট, পৃথক নেটওয়ার্ক, এনক্রিপশন) এবং স্পষ্ট ডকুমেন্টেশনের মাধ্যমে, ধারণা থেকে সম্পূর্ণ কার্যকরী এআই সহকারীতে যাওয়া সহজ। কার্যকরী সহকারী যা বসার ঘরে বা অফিসে ভালো কাজ করে।