XML document store

XML document store
2021-03-17T16:01:44+01:00
2021-03-18T02:59:10+01:00
2022-10-17T10:40:32+02:00
  • Picit a postgres-ben utánaolvasva arra jutottam, hogy előjöhet egy-két buktató, kezdve a fájlok karakterkódolásától az indexelésig.

    Azt olvastam, hogy séma-ellenőrzést sem végez a postgres, bár ez a konkrét esetben akár jó is lehet.

    Lebeszélni nem akarok senkit.
    Mutasd a teljes hozzászólást!
  • Én nem használtam még ilyet, az a gyanúm, hogy ott lehet hasznosabb, ahol többféleképp kell belenézni az xml-be. Őszintén én az xmlt nem tartom igazán jó adattárolási/közlési formának.

    Ha a topiknyitó kipróbálja, szerintem szívesen vesszük, ha megosztja a tapasztalatait.
    Mutasd a teljes hozzászólást!
  • Nem pont erre valóak az XML adatbázisok?
    Mutasd a teljes hozzászólást!
  • Szerintem nincs értelme az adatbáziskezelőt terhelni az xml-ekkel. 50 millió rekord sok adat, annyinál már az egyszerűnek tűnő műveletek is elég időigényesek tudnak lenni. A backup sem egy egyszerű történet.

    Gyárts egy programot, ami kinyeri az xml-ből az indexelendő adatokat, és csak azokat tölti fel az adatbázisba valami jól szituált azonosítóval. Ez persze lehet a fájlnév is, bár ha csak 64 karaktert hagysz a fájlnévre, 50 millió rekordnál már az is 3 GB.
    Mutasd a teljes hozzászólást!
  • Szia!

    Az MSSQL szereti az xml fájlokat, van külön adattípus rá, sajnos ezzel a részével nem foglalkoztam, hogy ajánlani tudjam, de érdemes ránézni.

    ui.: Postgres-nek is van xml típusa
    Mutasd a teljes hozzászólást!
  • Sziasztok,

    Össze kell raknom egy programot, ami XML dokumentumokat fogad, tárol és tesz kereshetővé egy API-n keresztül.
    Adottságok:
    - A tárolandó doksik száma mondjuk maximum 50 millió.
    - az XSD-je a doksiknak akkora, hogy kitapétázhatnám vele az irodát
    - az XSD néhány havonta változhat.
    - noha a séma komplex, keresni a fájlok között csak néhány elem alapján kell. (date, subject, id, ilyenek. de gyanitom, hogy ez is változni fog).
    - az alkamazásnak (azon túl, hogy keresni tudjon a fájlok között) nem kell tudnia értelmeznie az xml fájlokat.

    Az eredeti ötlet az volt, hogy létrehozunk egy a sémának megfelelő SQL adatbázist és ott tároljuk a bejövő xml-t, de miután megláttuk az xsd-t és megtudtuk, hogy viszonylag gyakran változhat, nagyon gyorsan más megoldás után kezdtünk nézni.

    A következő ötlet az volt, hogy az xml fájlokból kiszedjük azokat az adatokat amik alapján keresni lehet majd őket, és csak ezeket dobjuk be egy adatbázisba a fájl elérési útjával együtt. Igy kereshető is lesz és az adatbázis sémát sem kell folyton hozzáigazitani a változó xsd-hez.

    A másik ötlet, hogy valamilyen document store-t kéne használni, amiben mondjuk xquery-vel lehet keresni. Itt jön a kérdésem. Tudtok ajánlani olyan létező megoldást, ami XML állományokat tud fodani és tesz lekérdezhetővé értelmezhető sebességgel? 
    Az exist-db-t kezdtem el nézegetni tegnap, ezzel van valakinek tapasztalata?
    Mutasd a teljes hozzászólást!
Tetszett amit olvastál? Szeretnél a jövőben is értesülni a hasonló érdekességekről?
abcd