par
Berzemus » 17 août 2008, 18:43
Je m'étais un peu documenté sur google. Ils utilisent des "shards", des morceaux de texte, qui transitent un peu partout dans leur mémoire, avec une gestion très avancée de la recherche dans tout ça. De plus, tout leur index tient dans la ram de leurs serveurs; en plusieurs copies.
Si je me souviens bien, leur version hyper-développée de linux leur permet, dans leur data-center, de simplement brancher un PC sur leur réseau (autre chose que du gigabit..), le tout est pris en charge par leur OS (installation/configuration/etc..) et le tout ne forme qu'une seule et immense machine de calcul. Les machines tombent en panne sans problème, puisque le principe du système est la redondance. Ils n'utilisent pas nécessairement ce qu'il y a de mieux, mais ce qu'il y a de plus rentable niveau cout/puissance.
Je m'étais un peu documenté sur google. Ils utilisent des "shards", des morceaux de texte, qui transitent un peu partout dans leur mémoire, avec une gestion très avancée de la recherche dans tout ça. De plus, tout leur index tient dans la ram de leurs serveurs; en plusieurs copies.
Si je me souviens bien, leur version hyper-développée de linux leur permet, dans leur data-center, de simplement brancher un PC sur leur réseau (autre chose que du gigabit..), le tout est pris en charge par leur OS (installation/configuration/etc..) et le tout ne forme qu'une seule et immense machine de calcul. Les machines tombent en panne sans problème, puisque le principe du système est la redondance. Ils n'utilisent pas nécessairement ce qu'il y a de mieux, mais ce qu'il y a de plus rentable niveau cout/puissance.