Hadoop, PIG, Yahoo und OpenSource

by ischroedi on 19. März 2009

Crawler und Suchtechnologien

Nun bin ich nicht wirklich der Typ der irgendwie alles kann. Eigentlich kann ich nichts richtig. Immer nur ein wenig von allem. Aber gestern hatte ich ein Gespräch mit einem Menschen, dessen Projekt ich an dieser Stelle nicht näher nennen darf und will. Es geht um Suchtechnologien und die berühmt berüchtigten SEO Tools.

Da muss ich dann hören, dass dabei gigantische Datenmengen anfallen werden – “Echt?” Diese Datenmengen müssen dann verwaltet werden. Google macht das mit einer speziellen Speichermethode {eigentlich ist es ein Filesystem} (war das jetzt richtig? ) Namens Big Table. Eine große Tabelle, “fatz!” alles rein und dann regelmäßig wieder alles ausgeben.
An sich nichts schlechtes. Aber wenn man während des Informatikstudiums etwas anderes im Bezug auf Datenbanken gelernt hat wird das schon schwierig. Relationales Datenbankdesign oder Normalisierung haben bisher meinen Lebensweg geprägt.

Alles weitere überlasse ich erstmal den Spekulanten, nur so viel die Technologe gibts bereits seit 1968.

PIG

Das Abfrage Schwein. Yahoo hat eine andere Technologie und setzt Hadoop ein. Ähnlich wie das GoogleFileSystem (GFS) ist Hadoop eine Möglichkeit verteilte Filesysteme abzubilden. Ehemalige Linuxkumpels (http://www.linuxcamp.de) möchten es mir verzeichen aber es scheint mir so wie ein LVM im Internet.

  • del.icio.us
  • MisterWong
  • Technorati
  • StumbleUpon
  • Digg
  • Reddit
  • YahooMyWeb

Hat Dir der Artikel gefallen, dann Abonniere den RSS FEED

Tweet This Tweet This Twitter | Stumble This Stumble this or Delicious ThisDelicious this

Weitere Artikel die dir gefallen könnten

  • Ich bin der Yahoo! BOSS
  • Yahoo und Bing Backlinkchecker am Ende?
  • SEO News Pipe
  • Neue OpenSocial Initiativ – was bringt es dem User?
  • Microsoft greift nach Google Adwords
  • Building a Social Networking Website with Ruby on Rails
  • Digg.com Software soll verkauft werden
  • SERPS im Kreditbereich
  • Linux auf dem Iphone
  • Drupal-Buch kostenlos
  • Leave a Comment

    Previous post:

    Next post: