A keresők lelki világa

A keresők lelki világa
2007-06-01T07:33:38+02:00
2007-06-02T09:40:23+02:00
2022-10-30T11:50:38+01:00
  • nahh ha ezt megvalósítják akkor emelem kalapomat.. bár a közel 6000es alkalmazottból már rá lehet pár embert állítani a témára...


    Nos, nemcsak a Google dolgozik rajta. Nem is kell messzire menni... A cég, ahol dolgozom, épp ilyesmivel is foglalkozik. Elég nagy tudásbázisunk van mesterséges intelligenciából, szóval nem tartom reménytelennek a helyzetet Komoly projectek mennek most is mestint vonalon, de ezekről (még) nem beszélhetek :(
    Mutasd a teljes hozzászólást!
  • Keresők előtt linkgyűjtemények voltak.

    Amikor még egy-két weboldalon elfért az összes weboldal listája.

    Oszt ezekről lettek elindítva a keresők...
    Mutasd a teljes hozzászólást!
  • Szerintem az nem úgy általában ajánlott szavakat, mintha csak felcsapnád az értelmező szótárt az "a" betűnél, hanem valószínűleg a top keresések közül válogatott. Nálam a blogsearch.hu -n ilyesmi a "Most keresték" rész, ahol gyakorlatilag egy log van feldolgozva, ami a user-keresésekkor keletkezik.

    A minden szót külön tárolni, nem nagyon értem. Hogy gondoltad, mindegyiknek külön sor? Origo.hu-t "leindexeled, és máris van 3 millió rekordod. Why?

    Ja épp most olvasom, talán érdekelhet: Célkeresztben a jövő keresői
    Mutasd a teljes hozzászólást!
  • Persze azért csak gondolkozz rajta, mindenképpen nagyon érdekes terület.

    jaja kattant a fogaskerék, és most ezen agyalok.. a nagyratartott algoritmusokról próbálok infót gyűjteni, bár apróbb dolgokat találtam, de igazából jelmagyarázat nincs hozzájuk

    több mint 400 ezer szervert üzemeltet
    a guglis doc-okban csak 60ezerről olvastam, de azóta nőhetett éshát nem kevés egyik szám se

    Egyébként még (legalább) két ponton lehet nagyot dobbantani a keresők terén: intelligens szinonímakereséssel


    erről is volt szó a guglis videóban, de ők inkább az AI területét emlegették többször..

    Vagy gondoljatok csak arra, hogy hány esetben lenne hasznos keresni olyan képet, aminek a TÉMÁJA mondjuk egy autó, de nem találjuk meg, mert a neve mondjuk gdkjsfhjahfuiew.jpg

    nahh ha ezt megvalósítják akkor emelem kalapomat.. bár a közel 6000es alkalmazottból már rá lehet pár embert állítani a témára...

    továbbra is várom a hozzászólásokat, linkeket, hasznos infókat ezzel a témával kapcsolatban..

    (ui.: említettem, hogy a tárolásnál érdemes szavakra bontani az oldalakat, tehát minden szót külön tárolni.
    Ezzel kapcsolatban lenne egy olyan kérdésem, hogy volt a guglinak egy olyan kezdeményezése, hogy amikor beírtunk vmilyen szót a boxba akkor legördült egy cucc amiben pl.: a betűvel kezdődő szavaka voltak, tehát nekiállt felajánlani különböző szavakat. Ezt csak úgy lehet megvalósítani, ha minden szót külön tárolok, vagy akkor is, ha mondjuk egy oldalnak a szövegeit egy mezőbe tárolom ? Köfke aki tudja a választ )

    hát olvasmány az van bőven... megvalósíthatósági dolgok kevesebb azért pár jó, érdekes dolgot így is találtam..
    Mutasd a teljes hozzászólást!
  • Nekem ez a weboldalam php -s forráskódja:

    <?php $x = isset($_GET['x'])?$_GET['x']+1:0; echo "<a href=\"{$_SERVER['PHP_SELF']}?x=$x\">link</a>"; ?>

    sikerekben gazdag indexelést kívánok hozzá! ;)
    Mutasd a teljes hozzászólást!
  • Autora ugyan még nem, de ha képkeresésnél beirod az url végére hogy "&imgtype=face" akkor igyekszik olyan képeket keresni ahol arcok vannak. Szal adj egy kis időt lehet, hogy autoval is rovidesen mukodik...
    Mutasd a teljes hozzászólást!
  • Ja igen, közben utána olvastam, az erőművet nem a Google építette, hanem az már ott volt. Igazad van.
    Mutasd a teljes hozzászólást!
  • Én úgytudom, hogy nem folyó mellé települtek saját vízierőművel, hanem egy vízierőmű mellé települtek, ami ugye egy folyó mellett van.
    Mutasd a teljes hozzászólást!
  • Ez komoly?

    Egyébként még (legalább) két ponton lehet nagyot dobbantani a keresők terén: intelligens szinonímakereséssel, valamint képek tartalmának elemzésével. Beírom, hogy "fa", és azt is megtalálja, hogy "akác". Hülye példa, de nagyjából érthető.

    Vagy gondoljatok csak arra, hogy hány esetben lenne hasznos keresni olyan képet, aminek a TÉMÁJA mondjuk egy autó, de nem találjuk meg, mert a neve mondjuk gdkjsfhjahfuiew.jpg.

    A fentiek alapján látható, hogy bár sok találat jön, még mindig rengeteg olyan infót nem lehet megtalálni, amit szeretnénk, mert másképp írják, vagy nincs rendesen indexelve.
    Mutasd a teljes hozzászólást!
  • Ezért települtek folyó mellé, saját vízi erőművel.
    Mutasd a teljes hozzászólást!
  • Vajon mennyi villanyszámlát fizetnek? :D
    Mutasd a teljes hozzászólást!
  • Nem gondolod, hogy a Google alapítói és jelenlegi többszáz (többezer?) fejlesztője harakirit követne el, ha te most hirtelen rájönnél hogy is kell ezt a leghatékonyabban csinálni? Persze azért csak gondolkozz rajta, mindenképpen nagyon érdekes terület.

    Egyébként valóban, a Google-nak elég sok szervere van ráeresztve a témára - konkrét adat nem ismert, de egyes becslések szerint több mint 400 ezer szervert üzemeltet (na jó, nem mindet a keresőre, de a döntő részét biztosan arra).
    Mutasd a teljes hozzászólást!
  • ohh, köszke az eddigieket !
    bár úgy érzem a trolásos részét már fel se hozzam, hogy hogyan lenne optimálisabb

    van olyan megoldás, hogy:
    - amikor az oldal teljes tartalmát (szövegeket) kiszedik és egy mezőben tárolják el
    - és van olyan is amikor minden szó kap egy id-t meg egy külön mezőt

    a 2ikoldás elég durcán tud kinézni már egy prog.hu-s oldal esetében is, de lehet, hogy éppen így kell csinálni ?
    Mutasd a teljes hozzászólást!
  • Hát ennél sokkal bonyolultabb egy kereső, mint ahogy elképzeled. Néhány napja volt az m2-n a Google kulisszatitkai c. dokumentumfilm, ha nem láttad szedd le innen, át fogja kicsit rendezni a gondolataidat :)
    Mutasd a teljes hozzászólást!
  • van valahol egy 'kapu' ahol belépve kezdődik az internet

    Nem, nincs ilyen. Szvsz egyszerűen a googlebotot anno ráeresztették konkrétan valami oldalra (esetleg többre is), és azóta barangol a linkeken keresztül.

    merthát ugye mi van akkor, ha eg oldalra sehonnan nem mutat link, akkor azt hogy indexelik ?

    Szvsz azt sehogy, de szerintem nem nagyon van olyan, hogy egy oldalra egyáltalán nem mutat link. Mondasz egy példát?
    Ha tényleg, abszolút semmi link nem mutat egy oldalra, akkor minek is indexelje, hiszen valószínűleg úgysincs rajta releváns információ. A google arról szól, hogy információkat találj könnyen, gyorsan, közen pedig katalogizál. Egy nulla információt tartalmazó oldalra nincs is szükség, de mint mondtam, szvsz tuti, hogy van legalább egy link minden oldalra!

    Ez a fajta adatbázisba való beindexelés mekkora méretet tud ölteni ?

    Szvsz iszonyat nagyot - sokat hallani a google legendás szerver-parkjáról (igaz, nem csak a kereső fut rajtuk).

    Ugye guglinál is láthatóak ilyenek, hogy: page: 47.62kb, ez azt jelenti gondolom, hogy az sql-ben mekkora helyet foglal el.

    Hm. Ezen még nemgondolkoztam, de szerintem nem azt jelenti (miért írná ki a usereknek az sql-ben elfolglalt helyet???), hanem a googlebot egyszerűen az oldalak lekérésekor elmenti a méretüket is, hogy erről is informálhassa a felhasználókat - de az is lehet, hogy ez is beleszámít egy oldal pagerankjébe (egy nagyobb oldalon valószínűleg több releváns információ van).

    Tapasztalataim szerint a gugli pár nap alatt beindex egy új lapot, de most, hogy saját gépen tesztelem a dolgot, a prog.hu-t már jóideje indexeli, pedig ez csak 1 oldal vagy ezen is több gép dolgozhat egyszerre ?

    Hát ugye a google rendelkezik egy nem elhanyagolható méretű gépparkkal. Neked meg (ha jól vettem ki) egy gépen fut otthon a program, talán ADSL mögül... Azért nagyságrendi külömbségek vannak.
    És igen, több gép is dolgozhat rajta egyszerre, sőt!

    Nah, remélem jutsz vele valamire. Ha valaki jobban ért hozzá mint én, akkor majd úgyis kijavít, ha valahol hülyeséget mondtam.
    Mutasd a teljes hozzászólást!
  • Üdv !
    Nem mondhatnám, hogy nagyon unatkoznék, de mindig van vmi ami szöget üt a fejembe, és muszáj utánajárnom, esetleg megírnom, hogy mégis mi hogyan működhet.. nahh most egy kereső (gugli, yahoo...) ütött szöget jó mélyre...
    pár dolog már tisztázódott bennem egy próbaverzió, és jópár doc elolvasása után..

    1.kérdésem: honnan kezdik az indexelést a keresők ? van valahol egy 'kapu' ahol belépve kezdődik az internet ? merthát ugye mi van akkor, ha eg oldalra sehonnan nem mutat link, akkor azt hogy indexelik ?
    ( jelenleg úgy gyakorlok, h megadhatok linket, és azt alles zusammen beindexeli sql-be.. )
    De vajon, hogy lehet ráküldeni az egész netre ?

    2. Ez a fajta adatbázisba való beindexelés mekkora méretet tud ölteni ?
    Ugye guglinál is láthatóak ilyenek, hogy: page: 47.62kb, ez azt jelenti gondolom, hogy az sql-ben mekkora helyet foglal el.
    vagy ?

    Tapasztalataim szerint a gugli pár nap alatt beindex egy új lapot, de most, hogy saját gépen tesztelem a dolgot, a prog.hu-t már jóideje indexeli, pedig ez csak 1 oldal vagy ezen is több gép dolgozhat egyszerre ?

    huhh.. még tuti lenne jópár kérdésem, de nem jutnak eszembe nahh majd, ha közben van vmi még írom !!!

    a válaszokat, elméleteket, gondolatokat előre is thx !
    Mutasd a teljes hozzászólást!
Tetszett amit olvastál? Szeretnél a jövőben is értesülni a hasonló érdekességekről?
abcd