Hanggal történő irányítás
2021-05-16T19:54:25+02:00
2021-05-17T23:22:13+02:00
2022-07-20T10:16:48+02:00
  • A telefonos alkalmazás, és a telefonon elérhető webes alkalmazás alatt mit értesz ? 

    Hát hogy ahelyett, hogy beszélgetsz a telefonoddal, egy ikonnal felmész egy weblapra, ami esetleg jelszóval védett, de ott van rajta az alább leírt 6 műveletnek megfelelő gomb. Te meg megnyomod azt, amelyiket akarod, és lefut a program.
    Mutasd a teljes hozzászólást!
  • Az nem baj ha félrehallja, én sokszor a googleval is úgy keresek, hogy valamit hallok angolul és megpróbálom fonetikusan magyarul leírni (véletlenül sem helyesen), általában kitalálja hogy mit keresek. A hangfelismerés is így működik, hogy felismeri mi a legvalószínűbb, mit mondhattam. Ha egy listából kell választani, akkor könnyű dolga van a programnak. Ha meg kell értenie, akkor annyit fog érteni belőle, mint amikor a google fordítóval oda vissza fordítasz valamit. Csak így pont a lényeg veszik el. Az ugyanis nem nagy kunszt, hogy egy menüpontot futtasson le a programom. Elindítok egy menüt egy kattintás, kiválasztom mit akarok, esetleg bekér 1-2 paramétert és mehet. Teljesen felesleges a hangfelismerés vagy az, hogy fejből tudjam az utasítást elmondani. Az már hasznosabb lenne hogy valamit össze motyogok, a telefonom meg kitalálja hogy mit is szeretnék és megvalósul a program. Ebből a progiból én is kérnék és többé semmi szükség nem lenne ránk, programozókra.
    Mutasd a teljes hozzászólást!
  • Világos a hangfelismerés kockázata, és az sms esetleges késlekedése.

    A telefonos alkalmazás, és a telefonon elérhető webes alkalmazás alatt mit értesz ? Skype ?

    Esetleg ezt az egész ötletet, amit felvetettem, el lehet vinni abba az irányba, hogy távolról érkező, heterogén parancsokat egy bizonyos időközöként futó szervíz feldolgoz ?

    Pl. tegyük fel, 1 helyre, legyen az mondjuk egy email box, megérkeznek a követkzők 1 levélben :

    cmd del temp\* older 3 May 2017
    cmd cd buildDirectory | build
    cmd cd testDirectory | startTests.bat
    start IntelliJ
    start linuxEmulator   (ez mondjuk elindit egy Linux consolet)
    runLinuxCommand apt-get install.....    (ez meg a Linux console-n belül történne)

    Tehát itt felteszem, hogy helyesen leírva rendelkezésre állnak a végrehajtandó feladatok. És ezt mind 1 lépésben távolról küldeném el, mondjuk a fiktív megbeszélésről.

    Persze lehet, nem email-ben kellene kapni a feladatokat, hanem egy másik alkalmazással, de nem tudom, melyik lenne jó erre,
    Mutasd a teljes hozzászólást!
  • Én óvnálak a saját elképzelésedtől. Az ilyem hangfelismeréses rendszereknél még a legjobbak is gyakran félrehallanak egy két szót. Ez a törlésekkel kombinálva igen aggasztó helyzetekhez vezethet.

    Az sms-ek ezen felül könnyen tudnak perceket késni. Arra sem vennék mérget, hogy biztosan sorrendben érkeznek.

    A megbeszéléses problémádra a megoldás a telefonos alkalmazás, vagy akár csak egy telefonon keresztül elérhető webes app.
    Mutasd a teljes hozzászólást!
  • Azokat a példákat, amiket említettél mint AI helper, meg lehetne így csinálni.

    Olyan esetekben lehetne hasznos, amikor nem tudunk rögtön a számítógépen cselekedni.

    Pl. egy megbeszélésen elhangzanak ötletek, mit kellene csinálni. Ilyenkor gyakran nem csináljuk meg ezeket a megbeszélésen, csak utána. Az is sokszor előfordul, hogy a megbeszélés után pont ebédszünet jön, vagy egy másik megbeszélés. Tehát akár több óra is kieshet a konkrét cselekvés előtt, holott a megbeszélésen már pontosan tudjuk, mit akarunk csinálni. Pl. elkezdeni egy automata tesztet, ami akár több óra lefutású is lehet. Ehelyett a gépünkhöz kerülünk mondjuk 1 óra mulva, majd elindítjuk a több órás tesztet.  Itt vesztettünk 1 órát, és ha több ember vár a teszt eredményére, akkor mindenki veszít 1 órát (nyilván ezlatt mást is csinálhat az ember). A holt időt akarom megspórolni, ami aközött telik el, hogy már tudjuk mit akarunk és a cselekvés kezdete között. A megbeszélésen szimpla üzenettel el lehetne indítani a tesztet. Mert egy megbeszélésen általában tábla van, beszéd van, fut egy Power Point, stb. De általában nem indul el se egy teszt, se egy build, se egy könyvtár törlés, stb. Megbeszéljük, hogy mit kellene, de nem cselekszünk, csak később, ha újra a helyünkre kerülünk az irodában. Nyilván ott helyben a megbeszélésen is el lehet indítani a tesztet, de lehet, hogy nincs is ott a megbeszélésen a személy a laptopjával, aki el tudná indítani a tesztet. A teszt elindítása alacsonyabb szinten (a parancsok szintjén) történik, mint a beszéd szintje, hogy "inditsd el a tesztet !". A feladat (teszt elindítása) nem változik, csak van a beszéd szint és számítógép parancsának szintje. Általában a programozó vagy a tesztelő indítja el a tesztet, de más csapattagok is tudják, hogy el kell azt indítani.

    Illetve az sms küldéssel a csoporton belül szélesebb körben tudnak az emberek hatni a projektre. Bárhol a városban eszünkbe jut valami a projekttel kapcsolatban, amit az említett módon tudunk automatizálni, akkor a mobiltelefonba bemondjuk, elküldjük, majd a szervíz feldolgozza az emailben kapott utasítást. Nem kell a számítógépünk előtt lenni. Lehet, otthonról be se tudunk lépni a rendszerbe (ez ritka), de a (hang) email-es üzenet segítségével ezt meg tudjuk tenni. 

    Sokszor nem programozók is tudják, mit akarnak a projekttel kapcsolatban. Ekkor be tudják mondani a saját megfogalmazásukkal az üzenetbe, amit aztán a feldolgozás oldalán a számítógép számára értelmes utasításokká alakítunk, majd végrehajtjuk.

    Pl. bemondja az üzenetet egy nem programozó, grafikus designer, aki weblapot tervez :

    "cmd delete all file in directory temp"
    és ezt a feldogozás során

    "cmd del temp\*"
    paranccsá alakítjuk és végrehajtjuk. Nyilván itt egy jól megírt parsert kell alkalmazni.

    Sokkal előbb lehetne cselekedni, ha a korán megfogalmazott gondolatok nem több emberen és megbeszélésen keresztül jutnak el a végrehajtás szintjére, hanem szinte rögtön, az 1. megbeszélés, vagy a feladat megfogalmazásának szintjén.
    Mutasd a teljes hozzászólást!
  • És tudsz mondani use-case-t, ahol ez hasznos tud lenni? Kiknek készülne?
    Mutasd a teljes hozzászólást!
  • tulajdonképpen email, nem is email szerver.

    A lényeg, hogy az üzeneteket (parancsokat) email címre (pl. test_commands@gmail.com) akarom küldeni, ahonnan azokat egy bizonyos időközönként futó szervíz kód kiolvassa majd feldolgozza a leírt módon. Vagy akár azonnal kiolvassa,
    Mutasd a teljes hozzászólást!
  • de az email szerver oldalán

    Még mindig nem értem, hogy mi ez az e-mail-es dolog..
    Mutasd a teljes hozzászólást!
  • Amiket írtál, szerintem egyszerűen megcsinálhatóak.

    A hanggal történő üzenet küldés első szava a környezet lehet, ahol az azt követő sorok parancsként értelmeződnének.

    Pl. ezt diktáljuk be : cmd del *.png

    Az email boxban megjelent bediktált sor kiolvasódik az emailből, majd megnyitja a cmd-t, hiszen ez a környezet, amit megadunk. És lefuttatja a törlést.

    De ha pl. ezt diktáljuk be :
    browser www.facebook.com
    ,

    akkor egy browsert nyitunk meg, pl. Seleniummal, és betöltjük a Facebook-ot.

    Tehát teljesen más parancsok is kiadhatóak lennének az üzenetben, pl. "cmd", "browser", "start" (ekkor mondjuk egy applikációt nyitunk meg, pl. a Total Commandert ha az van a "start" után) :

    És amit írtál, hogy törlés régebbi fileokra, egy egyszerűsített módon a dátumokat is be tudnánk mondani az üzenetbe. Persze amikor kiolvassuk az emailből a parancsokat, akkor ott kellőképpen intelligens programnak kell lennie, ami fel tudja dolgozni a komplexebb üzenetet is, pl. a dátumra vonatkozólag.

    Pl.
    cmd delete *.png where date is older than 3 May 2021

    Ez lenne a 2 hétnél régebbi png fileok törlésének a parancs. Természetesen a hang feldolgozás miatt a "where date is older" részt lehetne rövidíteni, "older"-re, és akkor csak azt kell az sms küldéskor helyesen megérteni, szerintem ezt nagy valószinűséggel szinte mindig jól fogja értelmezni a küldés :

    cmd del *.png older 3 May 2021

    És a feldolgozás oldalán lennének kisebb intelligens programok, amik várják a paramétereket, törléskor a dátumra vonatkozólag, stb. Most azt nem tudom, hogy parancsori del kiadásakor dátumot meg lehet e adni. Biztos vagyok benne, hogy igen. Ekkor nem is kellene semmilyen intelligensebb kód, csak egyszerűen az emailben kapott parancsot ki kell adni a cmd-ben, mert a cmd az üzeneben megadott környezet.

    vagy :

    "cmd cd buildDirectory\ | build"

    Ez lehetne egy build futtatása. Itt a | karaktert valamilyen módon be kell mondani.

    A buildDirectory-t persze lehet, bildDirectorynak értelmezi a hang feldolgozó, de az email szerver oldalán ezt vizsgálni lehetne, és a bildDirectory-t buildDirectory-ra alakítani egy rutinnal.
    Mutasd a teljes hozzászólást!
  • Programozol, nem?
    Látsz olyan use-case-t, ahol szerinted ez használható és hasznos dolog lenne?

    Én nem igazán hiányoltam hasonló feature-t.
    Sokkal inkább, valami okos AI helper-t.
    "Törölj minden 2 hétnél korábbi png-t az összes almappából"
    "Mutasd az xy.csv 3 és 5 oszlopának plotját"
    "Nyisd meg xy projekt src/akármi.cpp-t"
    "build"
    "diff-eld az xy branch azonos fájl-át"

    Ilyesmi menő lenne :)
    Mutasd a teljes hozzászólást!
  • Elnézést kérek, amatőr volt a kérdésem. Ma később odáig eljutottam, hogy hang üzenetet küldök emailre. Végül is ezt akartam
    Mutasd a teljes hozzászólást!
  • Sziasztok

    a hanggal történő sms küldés alapján gondolkodtam a következőn. Van olyan alkalmazás, ami sms-t email címre küld. Van értelme annak, csak az emailre történő sms küldésnél programozással kapcsolatos kifejezéseket, utasításokat, strukturákat mondunk be, ami az említett applikációval emailre küldődik el, amit majd időközönként egy másik alkalmazás kiolvas, és 1-1 fordító programnak vagy egyéb értelmezőnek ad át ? Úgy láttam, van olyan alkalmazás, ami beszéd alapján csinál forrás kódot, de én arra gondoltam, hogy nagyobb lehet a szabadság akkor, ha nem egy konkrét alkalmazást használunk, hanem a mobiltelefonba való bemondás (és emailre küldés után) arra az alkalmazásra bízzuk az email címre érkezett adatok feldolgozását, amelyik az emailboxból kiolvassa az új, ezúttal programozással kapcsolatos utasításokat.

    Van ennek értelme ? Könnyen össze lehet ezt állítani meglévő komponensekből. Használják ezt a valós életben ?
    Mutasd a teljes hozzászólást!
abcd