web-dev-qa-db-fra.com

Différence entre Hadoop et Nosql

Je voudrais connaître la différence fondamentale entre hadoop et nosql

  • Quel est le besoin de Hadoop?
  • Quel est le besoin de NoSQL?
  • Sont-ils les mêmes?
14
Manikandan

Hadoop fait référence à un écosystème de packages logiciels, y compris MapReduce, HDFS et un ensemble complet d'autres packages logiciels pour prendre en charge l'importation et l'exportation de données vers et depuis HDFS (Hadoop Distributed FileSystem). Lorsque quelqu'un dit: "J'ai un cluster Hadoop", cela signifie généralement un cluster de machines fonctionnant toutes dans cet écosystème général avec un grand système de fichiers distribué pour prendre en charge le calcul à grande échelle.

NoSQL fait référence à des solutions de base de données non relationnelles ou au moins non SQL telles que HBase (également une partie de l'écosystème Hadoop), Cassandra , MongoDB , Riak , CouchDB , et bien d'autres.

Hadoop - cadre informatique

NoSQL - pas seulement - bases de données SQL

37
Xorlev

Selon Wikipedia:

Hadoop :

Apache Hadoop est un cadre logiciel open source qui prend en charge les applications distribuées gourmandes en données, sous licence Apache v2 . 1 Il permet aux applications de fonctionner avec des milliers d'ordinateurs indépendants et des pétaoctets de données.

NoSQL :

En informatique, NoSQL (principalement interprété comme "non seulement SQL" 1 ) est une large classe de systèmes de gestion de base de données identifiée par sa non-adhésion au modèle de système de gestion de base de données relationnelle largement utilisé; c'est-à-dire que les bases de données NoSQL ne sont pas principalement construites sur des tables et, par conséquent, n'utilisent généralement pas SQL pour la manipulation de données.

Ce n'est pas la même chose, mais ils sont liés aux données. Hadoop est un framework complet (qui peut être utilisé avec NoSQL DBMS comme Oracle NoSQL ).

Je pense que vos questions vont dans la mauvaise direction.

hadoop est le nom d'un système de fichiers distribué appelé hdfs et une possibilité d'utiliser le paradigme de réduction de carte pour des calculs à grande échelle. Depuis le fil, il est également possible d'utiliser un cluster hadoop avec beaucoup plus de tâches (comme tempête, ruche, etc.).

nosql fait référence à des bases de données non interrogées par sql et n'utilisant pas nécessairement des tables, etc.

vous voudrez peut-être jeter un œil aux pages wiki de hadoop et noSQL pour mieux comprendre les différences entre les deux

6
Matthias Kricke