za sistem koji je dizajniran "pre neki dan" stvarno je cudno da mongo ne ume da koristi bar neki brzi lzw ili lz4 ili tako nesto .. odavno smo svi svesni da su nam db serveri overloadovani na IO delu dok proecsori lade jaja 99% vremena... takodje vezano za brzinu i nove tehnologije, vrlo je cudno da sistem dizajniran "pre neki dan" ne ume da koristi 2-3 level cache, danas sa mega brzim ssd diskovima koji su beskorisni za cuvanje velike date (previse $$$) doticni extra dobro mogu da rade kao 2nd level cache.. svi filesystem-i dizajnirani skoro umeju to da koriste, vrlo cudno da nijedan od novih "document storage" sistema to ignorise ... etc etc .. ima tu jos mnogo stvari koje bi covek ocekivao od monga, kasandre .. a koji ne postoje, koji bi ih ucinili znacajno upotrebljivijim .. sad, moram da priznam da nisam pratio worklog entries za mongo/kasandru pa ne znam da li je tako nesto planirano vec ili ne ..
secam se kada je krneta pricao pre 20tak godina kako je alfa sa 64 bita resila problem baza jer ce ram da bude mnogo jeftiniji te ce cele baze da sede u ramu, ono cega se tada nije setio je da ce velicina date koju cuvamo rasti mnogo brze nego sto padaju cene rama ..
elem, nadam se da ne smaram sa klasterom u mongodb temi ali bas upravo nesto diskutujem sa kolegama, ono sto mccge recimo vec resava a ima i transakcije i relacije i ...
- Sharding
- Cross-shard transakcije (nema nijedan od ovih open source dokument storage sistema tipa mongo, kasandra..)
- Pushed down predicate filters / programs ( nema nijedan od ovih ..)
- Pushed down joins / Adaptive Query Localization (ovi nemaju ni join a kamoli pushed down joins)
- Cross-shard consistent backup (ovo nisam siguran kako se radi sa mongo/kasandrom)
- Online resharding (ovo mongo ume ako sam ja dobro svatio, nisam probao doduse)
- Pruning of cross-shard scans to single shards (nisam siguran kako ovo radi mongo ali mislim da ne radi ovako brzo)
- Distributed transactional DDL (recimo da mongu ovo nije problem)
- Batched cross-shard parallelism (ne znam da li ovo mongo ume, realno bi trebalo da ume)
- Synchronous replication (ovo nema nijedan od ovih ...)
- Automatic Failure detection, failover and recovery (ok ovo bi trebalo da radi sa mongom jedino sto je sa ndb-om data uvek accessible a sa mongom je eventually accessible sto je ogromna razlika, na ndb-u ako crkne jedan nod sva data je up to date i dostupna)
...
pricamo o sistemu (mysql cluster) koji je dizajniran da rani na ruterima, PC racunar tada nije bio dovoljno stabilan da tera tako nesto, dakle pricamo o vremenu pre 20+ godina .... realno je ocekivati da sistem koji je dizajniran pre neki dan prevazidje 20+ godina star dizajn ...