Das chinesische Start-up DeepSeek hat mit seinem neuen KI-Modell R1 für Aufsehen in der Tech-Branche gesorgt. In Ausgabe 3/2025 zeigt das IT-Profimagazin iX: DeepSeek punktet im Vergleich zur westlichen Konkurrenz mit Open Source und günstigeren Services. Das Sprachmodell kann es außerdem mit den besten Modellen von OpenAI aufnehmen und übertrifft diese teilweise sogar.
Während westliche Tech-Konzerne Milliarden in ihre Sprachmodelle investieren und deren Entwicklung streng geheim halten, präsentiert DeepSeek sein KI-Modell als Open Source. „Die KI-Ingenieure der großen Firmen analysieren sicher bereits sehr genau, was DeepSeek gemacht hat und wie sie davon profitieren können. Ein heißes Rennen beginnt“, kommentiert iX-Redakteur Philipp Steevens die Entwicklung. Fachleute sind von der leistungsfähigen Konkurrenz aus China weniger überrascht.
DeepSeek-R1 zeichnet sich durch seine besonderen Reasoning-Fähigkeiten aus und setzt neue Maßstäbe beim maschinellen Denken: „Das Modell kann komplexe Probleme systematisch lösen und macht dabei seine ‚Gedankengänge‘ transparent – im Gegensatz zu den oft undurchsichtigen Antworten anderer KI-Systeme“, erklärt Steevens. Bei Logikrätseln prüft es systematisch alle Möglichkeiten und entscheidet sich für die einzige widerspruchsfreie Lösung. „Auch bei mathematischen Aufgaben wie Primfaktorzerlegungen demonstriert das Modell strukturiertes Vorgehen.“
Der kostenlose Service erfordert lediglich eine Registrierung. Wer das Modell selbst betreiben möchte, benötigt allerdings leistungsstarke Hardware: Etwa 1,3 TByte RAM, also zehn leistungsstarke Nvidia-H200-Grafikkarten mit jeweils 141 GByte Speicher, sind notwendig. „Für ressourcenbeschränkte Anwender bietet DeepSeek auch kleinere, quantisierte Modelle an – allerdings mit Qualitätseinbußen“, betont der iX-Redakteur.
Experten sehen die fehlende Transparenz bei den Trainingsdaten kritisch. Es gibt Vermutungen, dass das Modell mit GPT-4-generierten Daten trainiert wurde. Zudem achtet das Frontend auf Konformität mit chinesischer Politik.
Unabhängig der Kontroversen entwickelt sich DeepSeek rasant weiter und hat mit dem Janus-Modell bereits ein multimodales System vorgestellt, das auch Bilder generieren kann. Steevens: „Die westlichen Tech-Giganten stehen zunehmend unter Druck.“
Quelle Heise
Alle Angaben ohne Gewähr
IT-Systementwickler Linux- und Netzwerke (m/w/d)
Burgbrohl
Heuft Systemtechnik GmbH
SAP Inhouse Consultant FI/CO/PS (m/w/d)
Espelkamp
HARTING IT Services GmbH & Co. KG
SAP Inhouse Consultant Business Warehouse & Datasphere (m/w/d)
Espelkamp
HARTING IT Services GmbH & Co. KG
Stellengesuch eintragen und von Arbeitgebern finden lassen - in 3 Minuten erledigt
» Jetzt starten
Neue IT-Jobs, ganz einfach per eMail:
Der Stellenmarkt für IT-Jobs