Lokale KI wird MASSIV unterschätzt! Alle Wege, KI komplett kostenlos & offline zu nutzen
Video Overview & Insights
In diesem Video erfährst du, wie du leistungsstarke KI-Modelle komplett lokal auf deinem eigenen Rechner betreibst, ohne Abo, ohne Cloud, ohne dass deine Daten irgendwo landen.
Local AI Report kostenfrei downloaden: https://www.kiberatung.de/report/lokale-ki
Hier habe ich ein 2h Komplett-Video zu lokaler KI und CorporateLLMs aufgenommen: https://youtu.be/uv0fL2nEtSI?si=JfYTBDQnsOomQ1XU
Local AI Report kostenfrei downloaden: https://www.kiberatung.de/report/lokale-ki
Lokale KI im CorporateLLM nutzen: https://corporatellm.de
„ passt auf jeden Arbeits Laptop mit 16 GB VRAM“ 😂😂😂
Lokale KI im CLLM anbinden: https://docs.corporatellm.de/guides/ollama-secure-connection
Du hast ein Unternehmen, willst den Anschluss nicht verpassen und dir durch KI-Integration einen Wettbewerbsvorteil sichern? Wir implementieren KI-Lösungen in deinem Unternehmen, die WIRKLICH Umsatz bringen und ganze Stellen einsparen. Sichere dir hier kostenfrei ein persönliches Analysegespräch: https://www.kiberatung.de/?utm_source=kiberatung.de&utm_medium=YouTube&utm_campaign=Beschreibung&utm_content=Everlast%20AI
Was für ein Unsinn, da kommen soviele Falschergebnisse....Scheiß KI brauch kein Arsch💩
Du willst als Arbeitnehmer deine Zukunft sichern und dein Gehalt durch handfeste KI-Fähigkeiten steigern? Lerne alles auf der Nr.1 KI-Weiterbildungsplattform: https://kilernen.de
Du willst dich selbstständig machen mit AI Automations und eine KI-Agentur aufbauen? Dann sichere dir hier kostenfrei ein persönliches Potentialgespräch: https://aiagentur.de/?utm_source=aiagentur.de&utm_medium=YouTube&utm_campaign=Beschreibung&utm_content=Everlast%20AI
Achtung ⚠️ die Aussage das man Claude Models DSGVO Konform nutzen kann, wenn sie in Europa gehostet sind ist NICHT RICHTIG. Es gilt: Da es sich um ein US-Unternehmen handelt, unterliegt es dem US Cloud Act und die USA ist auch dann in der Lage per Verfügung auf die Daten zuzugreifen.
Du bist Arbeitssuchend oder Arbeitnehmer und willst durch Fähigkeiten im zukunftssicheren Bereich der AI-Automations deine Karrierechancen steigern? Oder du bist Unternehmer und willst deine Mitarbeiter schulen lassen? Dann bewirb dich auf unsere zertifizierte AI-Automations-Manager Weiterbildung: https://aiautomationsmanager.de (Warteliste)
Mit diesem Tool mache ich meine Transkriptionen, sodass ich nicht mehr tippen muss: https://voicely.de
Ich habe die letzten Jahren schon immer mal wieder mit lokalen LLM‘s gearbeitet. Wer auf dem Mac Models nutzen möchte sollte sich mal oMLX anschauen. (Ich nutze ab jetzt kein Ollama oder LM Studio mehr). Auf meinem Mac mini Pro mit 64 GB RAM laufen verschiedene Models mit 200 t/s. Z.B. Gemma 4 MOE + DFlash.
Senke deine menschliche Telefonzeit auf Null und steigere deinen Umsatz durch AI Voice Agents: https://www.kiberatung.de/ki-telefonassistent/?utm_source=kiberatung.de/ki-telefonassistent&utm_medium=YouTube&utm_campaign=Beschreibung&utm_content=Everlast%20AI
Bleibe immer auf dem Laufenden und hole dir die wichtigsten KI-News direkt in WhatsApp mit dem „Everlast AI" WhatsApp-Kanal: https://whatsapp.com/channel/0029Vb6jkNVFsn0WTfbbzH2t (100% kostenfrei & anonym)
Ich habs letzte Woche getestet. Lokale KI ist der größte Schrott! Und die Oberfläche, wie z.B. OLpen WebUI ... Bin ich etwa Beta-Tester von Beruf? Die lokalen LLMs sind grottenschlecht in den Formulierungen und können mit Sprache nicht umgehen. Bildgenerierung null Chance. Für wen Volksschulniveau ausreicht ... gut.
Alle kostenfreien Ressourcen aus unseren Videos findest du in unserer Community: https://www.kiberatung.de/ki-champions
----------------------------------------------
Kann ich in der gratis Coporate llm Version auch Teammitglieder einladen?
Wir bei Everlast AI sorgen für mehr Umsatz – mit weniger Arbeit. Mit einem messerscharfen Automatisierungs-Fokus, einer Passion für digitalisierte Geschäftsprozesse und der Implementierung von Künstlicher Intelligenz im Unternehmen, haben wir die letzten Jahre einen neuen Branchenstandard zementiert. Als digitale Beratungsagentur sind wir stolz darauf, uns als Marktführer in Sachen KI für KMU und Großunternehmen etabliert zu haben. Wir vereinen die holistische Unternehmensberatung, um nur an den wirklich wichtigen Dingen zu arbeiten, sowie die Implementierung von KI-Prozessen (Done-For-You) durch unser Team an KI-Entwicklern, sodass Du Zeit und Kosten sparst. Als zugelassener Bildungsträger schulen wir zudem alle Stakeholder, Mitarbeiter und KI-Enthusiasten, sodass das Wissen zu 100% Inhouse bei Dir gesichert ist.
----------------------------------------------
Kannst du ein video zu design ki machen
Optimiere dein YouTube-Erlebnis mit diesen Kanälen:
• Everlast AI für ALLES rund um KI: https://www.youtube.com/@everlastai
Wo ist der Sinn hinter "lokal" wenn es am ende ja doch in irgendeiner Form verbunden ist mit den big tech unternehmen?
Klingt für mich eher nach hirnloser abschaffung deiner autonomie durch die hintertür.
• Die besten Ausschnitte aus unseren Interviews: https://www.youtube.com/channel/UCMSjKPOf6yQc746Ka1tZwfQ
• Leos persönlicher Kanal: https://www.youtube.com/channel/UCiKCgeGNFCoLF086q-Bl-HA
Nur wenn ich 128 Gigabyte habe und eine H20 für 12000€ dann ist das cool
• KI-Bubble für Insights & DeepDives in die KI-Welt: https://www.youtube.com/@ki-bubble
• Cinetiq für KI-Videos & Marketing: https://www.youtube.com/channel/UC6Y1kbmjgVozhs41nQ6QT8A
Super content! Danke! Ich stelle mir gerade vor wie 1 Milliarde lokale AI's gleichzeitig auf Volllast laufen und - sagen wir mal - pro Gerät 100W verbraten. Das wären dann 100 G Watt Stromverbrauch. Brutal!
----------------------------------------------
Folge mir hier überall, um nichts mehr zu verpassen:
Ein super Video, wie immer
• WhatsApp-Kanal - https://whatsapp.com/channel/0029Vb6jkNVFsn0WTfbbzH2t
• Spotify - https://creators.spotify.com/pod/profile/ki-revolution/
Absolut richtig, der Großteil der Nutzer braucht diese XXL-Modelle überhaupt nicht.
Um einen Nagel für ein Bild in die Wand zu schlagen, holt man ja auch keinen Bagger oder Presslufthammer.
Was macht die breite Masse denn prozentual gesehen wirklich mit KI?
Die wenigsten nutzen das für hochkomplexe Spezialaufgaben (Wie binde ich mir energieeffizient die Schnürsenkel?), wo solche Riesen-Modelle zwingend notwendig sind.
Oft reichen bereits die kleinen, lokalen Modelle für den Alltag völlig aus.
Und selbst die sind für viele over the top. Man sollte erst mal lernen, mit dem "kleinen Einmaleins" solide Ergebnisse zu erzielen, statt zu versuchen, den Weg zur nächsten Pommesbude mit einer Workstation berechnen zu lassen.
• Instagram - https://www.instagram.com/derleomartin
• LinkedIn - https://www.linkedin.com/in/leonard-martin-schmedding-415bba1a4/
Hätte das Video gerne geschaut, aber du siehst aus wie ein komm in die Gruppe Crypto Bro
• X (Twitter) - https://x.com/derleomartin
• Substack: https://everlastai.substack.com/
Hey ich hab durch Krankheit kein Zugang mehr zu meinem ursprünglichen job. Ich hab ne LTA Maßnahme bereits genehmigt. Ich schaue schon seit Monaten deine videos. Und ich will unbedingt in die ki schiene . Seit langem nutze ich zb stable diffusion, perplexity, gpt, gemini für verschiedenste Projekte und es ist geil. Naja zurück zum Kern meiner Frage. Was würdest du/ihr raten? Was sollte ich lernen, um in die Richtung KI Agentur richtig zu lernen und zu arbeiten? Aktuell bin ich beim Stand eine Umschulung zum Fachinformatiker ein Anwendungsentwicklung zu machen. Ich bin mir aber nie so sicher, ob das der richtige Weg ist. Vielen Dank schon mal
• Wir stellen ein! - https://everlastkarriere.de/
----------------------------------------------
Zum Thema: Offline-KI habe ich meine kostenlose SpeechToText-App "Voice2Win" beizusteuern - zu finden im Windows Store, demnächst auch für MacOS und Linux.
- Komplett kostenlos, offlinefähig & "NoCloud"
- SOTA-STT mit vielen extra Featues (z.B. Remote Smartphone Audio/Steuerung, Audio Signale, Clipboard/ScanCode/Unicode support, Keywords, uvm.)
- Hardware/Model Wizard, somit sehr einfach zu installieren/nutzen
- Whisper (für 3DGPU) und Parakeet (für CPU Hardware)
- Gesprächsaufzeichnung mit Sprechererkennung
- Optionale Block oder ASR-Stream-Transkription mit Echtzeitanzeige
- Direkte In-App Gemma 4 (auch 12B) Unterstützung (oder über Ollama/LmStudio weg das schon hat) für lokale KI-Aufbereitung/Verarbeitung
Viel Spaß damit!
00:00:00 - Worum geht es?
00:01:55 - Lokale KI Geschichte
Bei wem es nicht auf Geschwindigkeit ankommt UND Kosten sparen möchte kann sich auch ein gebrauchtes MacBook M1 Max mit 64GB RAM als Server kaufen. Die Dinger liegen zwischen 1500 und 1800 Euro. Darauf läuft bei mir ein Qwen3.6 40B 6-Bit von Huggingface. Die MLX Variante von DavidAU. Das ist mit 64k Kontext aber auch absolut am Limit dieser Hardware.
Stört mich aber nicht da ich dies als Brain hinter dem Agent Hermes verwende.
Ich baue mir damit gerade sowas wie Jarves über Home Assistent.
Nach dem ich viele getestet habe, kann ich hier sicher sagen, dass dies das Modell ist was auch wirklich sauber mit Tool calls auf der Hardware umgeht und trotzdem auch Klever genug ist die Arbeiten ausführen zu können, die ich erwarte. Bspw. Docker Container aufsetzen, Reperaturen auf Linux Systemen, Ideen einbringen wie man etwas umsetzen kann usw.
Hermes selbst läuft mit einem VL, TTS und STT auf einem kleinen M2 16GB und startet die kleinen Modelle nur wenn sie notwendig sind.
00:03:15 - Llama CPP Durchbruch
00:03:47 - Hardware Trends
Lokale KI-Modelle sind nicht komplett kostenlos. Man braucht entsprechende Hardware und eben Strom.
00:06:14 - Weg 1: Eigene Maschine
00:07:55 - Weg 2: Browser
Leider ist die Hardware so teuer geworden 😢
00:08:29 - Weg 3: Inferenz-API
00:09:14 - Weg 4: Eigener Server
Hallo Leonard, das ist wirklich super Content und eine messerscharfe Analyse.
Um das Argument der lokalen Hardware mit aktuellen Fakten aus der Praxis zu untermauern. Google liefert gerade den ultimativen Beweis für die Gefahr von geschlossenen Ökosystemen. Mit dem Start von "Gemini Intelligence" wird kurzerhand alles vor der Pixel 10-Generation von den neuen lokalen KI-Funktionen ausgeschlossen. Selbst Geräte, die hardwaretechnisch massiv ausgestattet sind, werden auf Knopfdruck degradiert, weil der Hersteller die Spielregeln der Architektur ändert.
Das zeigt die harte Realität. Hochglanz-Versprechen wie lange Update-Garantien sind wertlos, wenn die Hoheit über die Datenlogistik bei einem externen Konzern liegt. Wer sich auf diese Systeme verlässt, mietet nur im eigenen Haus und kann jederzeit per Software-Schnitt entmündigt werden.
Der absolute Schutz vor dieser Entwertung ist keine Software-Frage, sondern reine Physik. Wahre Autarkie erfordert den kompromisslosen physischen Besitz von eigener Hardware und Speicherbandbreite, die von keinem Provider aus der Ferne limitiert oder abgeschaltet werden kann.
00:10:15 - Weg 5: On-Device KI
00:10:53 - Überblick
Ich hab jetzt seit nen paar Wochen einen DGX Spark. Rein als inferencing Server. Ich kann das aber tatsächlich keinem, der nicht schon früher was mit Systemadministration zu tun hatte, empfehlen. Das Arbeitstempo und Ausgabequalität macht da immer noch recht wenig Spaß im Vergleich zu Cloud-KI. Selbst MoE ist da noch nicht gut genug. Das kann sich mit DiffusionGemma etc jetzt noch ändern, aber da ist das tooling noch ziemlich kaputt.
00:11:56 - Modelle richtig einbinden
00:13:26 - Use Case: Datenextraktion
Tolles Video, sehr spannend
00:15:06 - Use Case: OCR
00:15:47 - Modellwahl verstehen
Coole Infos. Momentan will ich lokale modelle auf Linux testen😅 hab ne AMD Karte...
00:18:14 - Use Case: Dokumentenchat
00:20:40 - Use Case: Wissenschat
Die KI ändert alles! Wirklich alles.
Moment… ich meinte die nicht‑lokale KI.
Oder doch die lokale KI?
Egal — nächste Woche „ändert sich wieder alles“, wenn der nächste YouTuber ein Video macht.
Das eigentliche Problem ist nicht KI, sondern die Cloud‑Abhängigkeit.
Wer die Infrastruktur nicht selbst kontrolliert, wird ausgebremst.
Europa wurde da perfekt vorgeführt:
Claude zu teuer, Copilot zu unflexibel — lokale KI passt.
Ich nutze qwen2.5‑32b‑instruct‑q4 und kann damit problemlos programmieren.
Nicht ganz auf Claude Fable‑Niveau, aber erstaunlich nah an Opus 4.8.
00:22:26 - Use Case: Prompt Templates
00:23:34 - Use Case: Anonymisierung
Klasse Video, Leo! Spricht mir zu 100 % aus der Seele. Mein Use Case, den ich mittlerweile komplett lokal umsetze: Ich habe ein portables KI-Studio entwickelt, das ohne Installation direkt von einer SSD läuft. LLaMA-Chat, Vision Lab und Image-to-Image laufen bereits 100 % offline und ohne Cloud-Abos. An den Modulen für lokale Audio-, Video- und Übersetzungs-Generierung schraube ich aktuell noch und merze die letzten Bugs aus, bevor ich sie freigebe. Es ist absoluter Wahnsinn, was lokale Workflows heute leisten. Der Trend geht definitiv weg von der Cloud!
00:26:17 - Grenzen lokaler KI
00:26:57 - Einordnung
Übrigens, auch für viele "Casual-Nutzer", die ChatGPT für allerlei chatbasierte Alltagsaufgaben verwenden, wären viele lokale Modelle mittlerweile längst gut geeeignet. Wenn das bekannter wäre (und wie einfach das umzusetzen ist), hätten die großen Frontiermodelle echt ein Wachstumsproblem bei der Nutzerbasis.
00:28:48 - Fazit und Ausblick
#künstlicheintelligenz
Vor 2-3 Wochen(!) (vor Monaten auch, aber da war es noch verständlich) wurde ich noch ausgelacht für die These, lokale KI ist die/ein wichtiger Teil der Zukunft.
More User Perspectives
Das Thema ist super spannend, aber wurde rasend schnell abgearbeitet. Lieber nochmal langsam in 40 oder 60 Minuten erklären wäre gut.
Man installiert scheinbar erst lokal ki Modelle, muss da aber geeignete Modelle für seine Hardware und Aufgabenstellung finden. Mit eurer web-app kann ich theoretisch auch auf anthropic, openai zugreifen? Aber nur mit Api oder zahlt man an euch?
Sensible Daten können anonymisiert werden, bevor diese in die cloud geschickt werden?
Ich kann aber auch auf anbieter zugreifen, die auf europäische Server ki Modelle lokal laufen lassen? Wo sind da die Unterschiede?
Die files die kurzwell gelesen hat würd ich auch gern sehen 😂
@widdim7499Danke für diese umfassenden Infos. Ich finde deine Videos extrem wertvoll. Allerdings muss ich sagen, dass ich das Gefühl habe dass du immer mehr eigene Werbung platzierst. Ich möchte unbedingt dass du an dieser tollen Arbeit auch profitierst! Für mich ist es aber immer ein Problem die Zeit für das Video schauen freizuschaufeln. Ich hoffe du findest weiterhin eine gute Balance zwischen Werbung und wertvollen Informationen. Danke dir!
@yehaaa6878super video
@anton0winWir entwickeln seit 2023 Full Stack AI Lösungen basierend auf vLLM - Wer Enterprise Lösungen für sein Unternehmen benötigt, kann uns gerne kontaktieren.
@FASTLANE-AI_CHKommt bald werbung für stromtarife hier? 😅 weil so ganz kostenlos sind die lokalen ja doch nicht?!
Grüße an alle! 😄
Ich habe seit März das MBP mit M5 Max und 128 GB - nutze es mit LM Studio, Ollama und Hermes Agent. Habe mir eine DuckDB erstellen lassen, die ich für eine Validierung von einer sehr komplexen Migration benötige und lasse durch lokale LLMs notwendige SQL Statements generieren und dokumentiere die findings. Nutze dafür Qwen 3.6, aber auch mal andere Modelle - Interessant, wie unterschiedlich dabei die Arbeitsweise ist - auf jeden Fall nicht konsistent - aber das ist eine der vielen Erfahrungen, die ich mit der lokalen KI gemacht habe.
@tuberichterLeo, das war dein schlechtestes Video bisher. Als Zuschauer seit Kanaleröffnung ist das aber immer noch ein (verstecktes) Lob. Ich habe leider gar nichts verstanden – und frage mich ernsthaft, ob das nur für Mac-User gemacht war?!
@Agent7779Mache ich schon lange. Privat mit einer 4070 Karte, und mittlerweile auf Arbeit, ich habs da eingeführt, auf einer AWS EC2 Ubuntu Maschine mit GPU. Da auch dort Entwicklungsprojekte laufen, konnten wir dort Agenten integrieren.
@martinhummel8775Falsche Daten sind bei den Kunden sicher sehr beliebt ;-) Ehrlich gesagt ist das extremes Gebastel und der Kunde hat "Glück" wenn er merkt dass er Grütze extrahiert hat.
@freeman71_gerwas hat Homematic damit zu tun ;-) (9:32)
@maxschautzer2057KI ist Scheiße, wir brauchen entlich wieder MI (Menschliche Inteligenz)
@Dumbo12345Ein Thema brennt mir unter den Nägeln: Chinesische Modelle sind für regulierte Unternehmen (KRITIS, NIS2, DORA, TISAX) sowie für deren gesamte Lieferkette nicht tragbar. Für Privatpersonen sind sie bestenfalls zweifelhaft. Welche leistungsfähigen Modelle bleiben für den on-prem Einsatz (Unternehmen, Freelancer, Privatperson) noch übrig, wenn man konsequent chinesische Entwickler und Anbieter ausschließt?
@alexandervonreu418Top! Danke! switzerland! CH! ;)
@terrytyler6920Gutes Video ich finde nur keine vernünftige Erklärung für das unnötige Tempo des Videos schade.
@cappuccinoMeetingOCR-Modelle scheitern oft an PDF Formatierungen. Macht man Print-to-pdf, wird es Grafik umgewandelt und wahrscheinlich besser lesbar für eine KI, die Grafiken lesen kann. Testet einer mal die Idee?😅
@drheynz2755Sehr gut 👍
@Darian1978Wir haben schon so einige Modelle auf dem Nvidia DGX Spark getestet. U.A. Gemma, Qwen. Sie kommen nicht an die Frontier Modelle ran. ABER für die meisten Automatisierungs UseCases absolut ausreichend. Ansonsten EU Alternativen suchen die euch Rechenkapazität auf den Open Weight Modellen bereitstellen.
Top Video! Lasst uns Europa souveräner machen.
kann mir einer sagen was ich auf einer 3080ti, 32GB ram und einem 5900x 12kerner noch gut laufen lassen kann?
@bastelbudiIch versuche zur Zeit das alles kostenlos zu realisieren. In der Pflege wird es etwas komplizierter:)
@kipflegerKostenlos
@RobertKaltschmittDann ist das ganze für meinen Bereich eh hinfällig
@kipflegerUnd ohne Apple und am PC 32 GB Ram`? Mir kommt das alles zeinlich madig vor, Gemini (google ai) ist mir sympatischer, wenn man das so nennen kann. Aber in meinem Falle Frankfurt west 3, mache ich mich von Googe abhängig
@kipfleger