Hangösszehasonlítás Javascript-el
2015-09-08T09:29:10+02:00
2015-09-09T11:18:51+02:00
2022-07-19T04:11:57+02:00
  • "

    A speech to text lehet a jó irány:

    "
    Ez a trivialis, de rossz minosegu megoldas, amit az elso hozzaszolasom masodik bekezdesenek elso mondataban letudtam :)
    Mutasd a teljes hozzászólást!
  • Nem az a nehezseg, hogy javascript vagy nem, hanem hogy aki ezt jol akraja csinalni, ertenie kene a beszedfelismereshez. Programnyelvi, technologiai gondokat en ebben a projectben nem latok, pl. a Warmup altal emlitett pocketsphinx.js-t kene testre szabnia (ami amugy C-s program, csak Emscripten-el van javascriptre forditva), csak ehhez erteni kellene, hogy hogyan mukodik a beszedfelismero belulrol.
    Mutasd a teljes hozzászólást!
  • A speech to text lehet a jó irány:
    A google-nak vannak erre megoldásai:
    pl. gillesdemey/google-speech-v2 ami persze napi 50 lekérdezés fölött fizetős, nem néztem mibe kerül, de gondolom megfizethető.
    A html5 meg modern böngészőkben támogatja az audio inputot. Pl. http://www.html5rocks.com/en/tutorials/getusermedia/intro/
    Szóval én ezekből kiindulva raknám össze, és 20-30 fejlesztői munkaórára saccolom.
    Mutasd a teljes hozzászólást!
  • De kliens oldalon a böngészőben? Böngészőben még a rögzítés is elég bonyolult. RecordRTC szóra keres rá a githubon, hátha kapsz belőle egy kis ihletet. De szerintem ezzel el leszel a következő 10 évben.
    Mutasd a teljes hozzászólást!
  • Tudom, hogy javascript nem a legjobb... webes alapon kellene kivitelezni ezért gondoltam js-re

    Sosem foglalkoztam még hangokkal max lejátszottam, ezért is keresnék olyan embert aki foglalkozott már valami ilyesmivel.

    Találtam már olyan kódrészleteket, melyek szép színes hangmintákat tudnak ábrázolni ezeknek az összehasonlításával esetleg működhet a dolog, de mint írtam még nem foglalkoztam ilyen dologgal.
    Mutasd a teljes hozzászólást!
  • Én is ezt akartam írni, csak lusta voltam ennyire kifejteni.
    Egy ilyen modul kifejlesztése messze nem triviális, több ezer emberórát igényel akkor is, ha eleve tapasztalt fejlesztők állnak neki a dolognak. Külön kiemelném, hogy a Javascript nem a legalkalmasabb a feladatra.

    Amugy pl. itt egy olyan API, amit a feladatodra talatak ki, persze nem ingyenes:

    Nem "pl. itt egy", hanem "itt az egyetlen". Senki más nem csinált még csak hasonló szintűt sem, ha jól tudom.
    "Persze nem ingyenes": nincs is lehetőség üzleti felhasználásra, ha jól látom.
    Mutasd a teljes hozzászólást!
  • Annyit erdemes tudni, hogy a feladat nehezsege kb. ekvivalens a beszedfelismeres nehezsegevel. (Na jo nem teljesen, mert mentesulsz azoktol a problemaktol, amik egy beszedfelismero rendszer legfelso retegeiben, pl. a fonemak -> leirt szoveg szinten jelentkeznek, illetve egy fix-el osszehasonliatani picit konnyebb, mint a semmibol eloallni a felismert eredmennyel) Nezd meg ugyanannak a szovegnek a spektogramjat ha egy no mondja vs. ha egy ferfi mondja, es latni fogod hogy miert nehez megmondani, hogy ugyanazt mondjak. Ez egy nehez terulet, jo beszedfelismero irasahoz sokat kell tanulni.

    Egy trivialis megoldas lehet, hogy hasznalsz egy szovegfelismero API-t, es osszehasonlitod a felismert szoveget az eredetivel. Ezt esetleg ugy tudod tuningolni, hogy egy ertelmes tavolsagfuggvenyt definialsz (bizonyos karakter kulonbsegeket jobban toleralsz, mint masokat)

    Pontosabb eredmenyeket csak ugy lehet elerni, ha egy beszedfelismero rendszert direkt ilyen celra 'atalakitasz' (kicsit olyan, mintha feltuningolnal egy autot), de ehhez is eleg nagy szakertelem kell.
    Azert lehet egy specialis rendszerrel jobb eredmenyt elerni, mert sokkal tobb reszeredmenyt tudsz felhasznalni a vegso szazalek kiszamolasahoz: neked nem egy beszedfelismero kimenetere van szukseged, hanem az alacsonyszintu belso retegeinek a kimenetere. (minimum fonemaszintre, vagy inkabb meg lejjebb, es nem a leirt karakter-szintre)

    Amugy pl. itt egy olyan API, amit a feladatodra talatak ki, persze nem ingyenes:

    http://www.rosettastone.com/speech-recognition
    Mutasd a teljes hozzászólást!
  • Nyelv tanulás lenne a cél.

    HTML, PHP és javascript, mert webes felületen szeretném használni.

    Azt elfelejtettem írni, hogy a program lényegében már teljesen készen van egyedül ez az egy modul hiányzik.
    Mutasd a teljes hozzászólást!
  • Nagyon tetszik :)
    Én egy javascriptes projektet találtam a pocketsphinx.js-t  ami a CMUSphinx javascriptesítésével jött létre. Szerintem vannak benne használható részek.
    Milyen nyelvre szeretnéd használni ?
    Nyelvtanuláshoz vagy biztonsági célra készülne a megoldás ?
    Mutasd a teljes hozzászólást!
  • 140 000 000 EUR + ÁFA.
    Mutasd a teljes hozzászólást!
  • Sziasztok!

    Olyan javascript-ben jártas programozót keresek projekt alapon, aki eltud készíteni egy olyan script-et, aminek az a lényege, hogy van egy adott mp3 fájl aminek a lejátszása után a felhasználó mikrofon segítségével vissza mondja a hallott szöveget és a program összehasonlítja, hogy mennyire volt hasonló az eredeti fájlal.

    Ezután kapunk egy százalékos értéket amit egy php változóba kellene átadnunk, hogy a program tovább tudjon dolgozni az értékkel.

    Érdekelne, hogy milyen áron tudnátok ezt elvégezni, és segíteni beintegrálni egy már jelenleg működő programba.

    Válaszotokat előre is köszönöm.

    Üdv,
    András
    Mutasd a teljes hozzászólást!
abcd