Mục lục:

Sistem De Conversație Bazat Pe Inteligență Artificială: 6 bước
Sistem De Conversație Bazat Pe Inteligență Artificială: 6 bước

Video: Sistem De Conversație Bazat Pe Inteligență Artificială: 6 bước

Video: Sistem De Conversație Bazat Pe Inteligență Artificială: 6 bước
Video: Un'introduzione alla Disautonomia in Italiano 2024, Tháng mười một
Anonim
Sistem De Conversație Bazat Pe Inteligență Artificială
Sistem De Conversație Bazat Pe Inteligență Artificială

Người tự động: Stanut Nicolae-Radu

Grupa: 333AB

Nota: 8

Bước 1: Descriere Funcțională

Descriere Funcțională
Descriere Funcțională

În precisioniu sistemul va fi asemănător

asistenților inteligenți pentru casă de tipul Trợ lý Google și Amazon Alexa, tasizatorii pot da comenzi vocale aparatului, iar acesta va răspunde sau va face o anumită acțiune, în funcție de cerințele Operatingului. Creierul acestui dispozitiv va fi un Raspberry pi 3, datorită faptului că dispune de Wi-Fi, acest lucru permițând conectarea la serviciul đám mây Amazon, care va da „inteligență” Sistemului.

Folosind serviciul de cloud și inteligență Artificială de la Amazon, acest dispozitiv va avea o funcționalitate danh tính thực tế của Amazon Alexa. De examplelu acest ảo liên tục poate prezenta starea meteo, poate ține minte notițe, poate pune alertme, dar din păcate (sau fericire?), Aceste lucruri depind în totalitate de Amazon, iar comenzile dispozitivului se dau în limba engleză.

Ca și obiectiv secundar, voi încerca să tích phân limba română astfel încât asentlyul să poată înțelege și comenzi și de la persoane necunoscătoare de limba engleză. Alt obiectiv secundar ar fi ca asentlyul să ajute la automatizarea unor procese, de exelu aprinderea și stingerea unor lumini, oprirea unei Prize. Desigur, doar dacă API-ul Amazon và permite aceste lucruri.

Sursa poză:

Bước 2: Thành phần

Pentru realizarea proiectului am avut nevoie de următoarele componente:

  1. Raspberry PI 3 B +

    Acest mini computer este creierul proiectului, rulează o verisune modificată de Linux Debian pe un procesor ARM. De asemenea, acest model dispune și de wi-fi, conexiunea la internet fiind tuyệt đối necesară pentru motoarele de text-în-vorbire și vorbire-în-text

  2. Máy ảnh mắt PS

    Pe post microfon ("urechea proiectului") am ales o cameră Destinyi consolei Play Station 3 deoarece dispune de un microfon puternic cu 4 canale, fiind mai ieftină decât o cameră web obișnuită

  3. Boxă portabilă

    Pentru a transmite Informația către useizator a fost nevoie de un difuzor, am folosit o boxă cu linh sam primită de la un prieten

  4. 2 lửa + đèn LED
  5. Caserolă

    Carcasa proiectului, o caserolă de sarmale: D

Bước 3: Phần cứng

Phần cứng
Phần cứng

După ce am adunat componentele, am trecut la implementare, giản đồ este una foarte simplă. Boxa portabilă se conectează la portul USB pentru alimentare și la portul jack pentru phát lại, camera / microfonul se conectează doar la portul USB Prince care comunică cu computer-ul. Am mai adăugat în schemă și led-ul conectat la pin-ul 17 cu rezistorul, pentru comanda de lumină. Nimic phức tạp.

Bước 4: Phần mềm

Arhitectura acestui proiect presupune un "creier" care să preia comenzi de la useizator (voce), să transforme datele într-un format accesibil lui (text) și să le redea răspunsul sau confirmarea unei acțiuni înapoi (voce). Pentru acestea a fost nevoie de 3 servicii riêng biệt:

  1. Un motor Speech-to-Text (STT), pentru a prelua datele de intrare (Informațiile transmise de usedizator Prince vorbire)
  2. Un Sistem de inteligență Artificială, pentru a lua decizii și a rezolva problemme
  3. Un motor Text-to-Speech (TTS), pentru a transmite useizatorului răspunsurile sau confirmările acțiunilor

Pentru STT am folosit API-ul de la Google, denumit Google Speech API, care este gratuit, oferă o calitate mare a convertiei și o rată mică de erori, dar oferă și un număr limitat de apeluri. Am ales acest API datorită faptului că această parte a sistemului este cea mai sensibilă la erori și cea mai supusă la perturbații. Datorită limitărilor phần cứng impuse de computer (putere de procesare, spațiu de stcare, memorie), folosirea unui serviciu offline este Excă, așa că am optat pentru un serviciu Cloud, oferind și o precizie mai mare, dar și un timp de răspuns mai bun, Google având unul dintre cele mai bune motoare STT.

Pentru feedback-ul oferit useizatorului (TTS-ul) am ales un motor offline, deoarece acesta nu este foarte mare tiêu thụ de resurse și nici nu este la fel de sensibil Preum STT-ul. Sintetizarea vocii este făcuta de Festival Hệ thống tổng hợp lời nói, chăm sóc este oferit gratuit phụ o chíță de tipul MIT. Vocea este una ușor robotică, dar mult mai inteligibilă față de eSpeak, alt motor TTS nhé. Avantajul său față de serviciile trực tuyến este că nu are niciun fel de limitare la numărul de coverii.

Liantul dintre STT și TTS, preum și partea "iteligentă" este platforma denumită Jasper. O platformă Mã nguồn mở, disponibilă pe GitHub la link-ul: https://github.com/jasperproject/jasper-client. Aceasta mặt legătura không cần thiết để đáp ứng dịch vụ descrise mai sus și ia decizii în funcție de input-ul Operatingizatorului. Este tương hợp cu Raspberry PI, fiind scrisă în Python. Am ales această soluție în detrimentul celor Cloud datorită modularității, platforma permite folosirea oricărui serviciu STT și TTS, dar și Defrea oricărei acțiuni folosind limbajul de programare Python.

Sistemul de inteligență Artificială este unul procedure, am optat pentru această variantă în detrimentul sistemelor de tip Machine Learning (chatbot) din cauză că cele din urmă au un caracter nedeterminist. Natura platformei Jasper, fiind bazată pe comenzi și acțiuni predefinite, limitează Capatea de concorbire, dar oferă un cadru potrivit pentru kỹ thuật số không ổn định, acesta fiind și scopul proiectului.

Bước 5: Triển khai

  1. Am instalat sistemul de operare Raspbian pe cardul microSD
  2. Am máy ảnh nónctat și difuzorul la Raspberry
  3. Am configurat Sistemul de operare, După care am instalat toate bibliotecile și serviciile necesare, urmând toți pașii din acest ghid:
  4. Am create și instalat module adiționale pentru a extinde funcționalitatea sistemului

Bước 6: Tiện ích

Image
Image
Utilizare
Utilizare
Utilizare
Utilizare

Din lipsa unui monitor am configurat dispozitivul să se conecteze la o rețea wireless predefinită, controlul dispozitivului realizându-se hoàng tử SSH. Jasper permite două tipuri de interacțiune:

  1. Prin terminal (text) - la rularea comenzii jasper_cli
  2. Prin voce - la rularea comenzii jasper

Din simplitate với începe demorarea funcționalității hoàng tử trung gian terminalului. La rularea comenzii jasper_cli va fi afișat un mesaj de întâmpinare, iar Jasper este gata să primească comenzi. Printre comenzile cunoscute se numără:

  • DEFINE + cuvânt - întoarce Defția din dicționar a cuvântului respectiv
  • AI, GÌ, BAO NHIÊU, BAO NHIÊU, BAO NHIÊU CŨ + cuvânt - folosește API-ul wolframalpha pentru a răspunde la întrebări chi
  • WIKI - folosește API-ul de la wikipedia pentru a oferi Informații despre diferite noțiuni
  • JOKE - spune o glumă
  • LUMOS / NOX - đèn LED màu vàng / đầu nhọn-ul atașat
  • TRIVIA
  • PHIM - Informații despre Filme (imdb)
  • TIN TỨC - citește știri

În modul voce, deschis la bringre comenzii "jasper" în linia de comandă, dispozitivul se pune în modul de așteptare, acesta fiind trezit la auzirea unui cuvânt-cheie. În cazul de față cuvâtul cheie este "Jasper". După ce dispozitivul a auzit cuvântul cheie, acesta intră în modul de ascultare, putând să primească comenzi chính xác ca și în modul văn bản. După executeutarea comenzii, dispozitivul intră din nou în așteptare până la o nouă trezire a sa.

Đề xuất: