Dem hoergen - Blog

unendliche seiten in den elektrischen wellen

Dem hoergen - Blog

  • Startseite
  • hyperblog
  • hoergen
  • moosiqpipl
  • Klangwerk
  • Forum
  • Kontakt
  • Anmelden

Open Source Voice Assistants

von hoergen am Jul 7, 2021 in Programme

Siri, Duo, Alexa, Cortana oder wie sie alle heissen. Diese digitalen Assistenten, die immer einen Kanal zur Hersteller Cloud brauchen und über diesen Kanal auch immer mithören und das natürlich auch beim Hersteller verarbeiten. Warum tut man sich sowas an und stellt sich eine Wanze ins Eigenheim? Man muss schon einen gehörigen Schaden haben sich sowas in sein privates Zuhause zu stellen und auch noch Geld dafür zu bezahlen. Egal. Es gibt für sowas OpenSource Alternativen. Hier will ich einfach mal ein paar aufzählen

 

  1. Kalliope - https://kalliope-project.github.io/
    Kalliope is a modular always-on voice controlled personal assistant designed for home automation. Kalliope can be installed on multiple linux system, and also on small single-board computers like the Raspberry Pi.

  2. Mycroft - https://mycroft.ai/
    Mycroft is the world’s first open source assistant. Mycroft runs anywhere – on a desktop computer, inside an automobile, or on a Raspberry Pi. This is open source software which can be freely remixed, extended, and improved. Mycroft may be used in anything from a science project to an enterprise software application.

  3. SUSI - https://github.com/fossasia/susi_linux
    This project aims at creating an implementation of Susi, capable to run on Linux Devices in a headless mode. It will enable you to bring Susi AI intelligence to all devices you may think like a Speaker, Car etc.

  4. Jasper - https://jasperproject.github.io/
    Jasper is an open source platform for developing always-on, voice-controlled applications. Use your voice to ask for information, update social networks, control your home, and more. Jasper is always on, always listening for commands, and you can speak from meters away. Build it yourself with off-the-shelf hardware, and use our documentation to write your own modules.

  5. Snips - https://snips.ai/
    Using Voice to Make Technology Disappear. Snips provides Private-By-Design, Decentralized Voice Assistant Technology and Solutions. Snips was built from scratch to protect your privacy. Everything runs directly on-device, meaning no one will ever hear your voice but you. This required over 4 years of research, during which our team pushed the limits of what can be done with AI on tiny devices. (Raspi)
    Update 21.11.2019 : Sonos kauft französische Sprachassistenten-Firma Snips

  6. Leon - https://getleon.ai/
    Leon is an open-source personal assistant who can live on your server. He does stuff when you ask him for. You can talk to him and he can talk to you. You can also text him and he can also text you. If you want to, Leon can communicate with you by being offline to protect your privacy.

  7. Mozilla DeepSpeech - https://github.com/mozilla/DeepSpeech
    Project DeepSpeech is an open source Speech-To-Text engine, using a model trained by machine learning techniques, based on Baidu’s Deep Speech research paper. Project DeepSpeech uses Google’s TensorFlow project to make the implementation easier. Blogbeitrag „Mozilla stellt weltweit größten Sprach-Datensatz kostenlos zur Verfügung“


  8. Almond https://almond.stanford.edu/
    Almond is the open virtual assistant that you can access through your phone and the web. It helps you configure your devices, accounts, and public services, retrieve data from them, and execute actions on them. It also lets you share your data with your friends and families easily. Oh, by the way, it’s open source and it protects your privacy!


  9. Vosk https://github.com/alphacep/vosk-api
    Update 07.07.2021

    Vosk is a speech recognition toolkit. Features:
    Supports 18 languages and dialects - English, Indian English, German, French, Spanish, Portuguese, Chinese, Russian, Turkish, Vietnamese, Italian, Dutch, Catalan, Arabic, Greek, Farsi, Filipino, Ukrainian. More to come.
    Works offline, even on lightweight devices - Raspberry Pi, Android, iOS
    Installs with simple pip3 install vosk
    Portable per-language models are only 50Mb each, but there are much bigger server models available.
    Provides streaming API for the best user experience (unlike popular speech-recognition python packages)
    There are bindings for different programming languages, too - java/csharp/javascript etc.
    Allows quick reconfiguration of vocabulary for best accuracy.
    Supports speaker identification beside simple speech recognition.

    Github https://github.com/alphacep/vosk-api

 

Es gibt sicherlich noch mehr. Falls ihr ein paar kennt, dann schreibt mir das bitte in die Kommentare.

 

 

Blogged on hoergen - hyperblog.de
Tags: Tags: FLOSSOpensourcedigital assistantvoice assistant
This entry was posted by hoergen and filed under Programme. Tags: FLOSS, Opensource, digital assistant, voice assistant.
  • « Linux Musikproduktion - Audio & Routing
  • Chia - Elektroschrott statt Energie »

Noch kein Feedback


Formular wird geladen...

Dem hoergen - Blog ist ein Ventil und Dokumentation des Dem Kollektivs im Kontinuum der elektrischen Wellen des Internets.
Tutorials impressum Haftungsauschluss hoergen on Friendica

Neueste Posts

  • Der Weg zur informierten Gesellschaft
  • Limitation Game: Systemd - CPUQuota
  • Touchpad / Touchscreen Gesten in Kubuntu
  • Warum ist die Gesellschaft so kaputt? Und was ist Glück?
  • Der Film Casablanca & die bemerkenswerten Geschichten
  • Prä-, Post-, Bullshit-Informationszeitalter
  • Happy Birthday hyperblog zum 18.
  • Real-time Noise Suppression Plugin - RNNoise
  • Klima - künstlicher Photosynthese und Wirtschaft auf Pflanzen umstellen - Hörempfehlung
  • Digitalisierung, Homeoffice und Algorithmen - Hörempfehlung
  • Vortrag Videoproduktion mit FLOSS beim SFD
  • KDE Fenster beim Mauszeiger öffnen
  • Snap aus Ubuntu & Kubuntu entfernen
  • Dark Mode überall im Web
  • Wenn das Umweltbewusstsein reinkickt
  • Das Märchen vom klimaneutralen Holz
  • Bereit machen für das »Klima-Endspiel«
  • Die Corona Komplettsicht
  • Barrier statt Synergy - Maus & Tastatur zwischen zwei Computern teilen
  • Texteditor Kate sortieren
  • Das immer wieder verlorene Wissen
  • Alternative Energien. Dezentral. Überall.
  • Kryptowährungen & Blockchain aus diesem Blog
  • Eine tmux.conf Konfiguration
  • Beim ssh login tmux aufrufen
  • Plugins - Windows VSTs 32/64 Bit mit YaBridge | Linux
  • Weniger Deutschland mehr USA
  • Schon wieder CDU? Bereichern sich Kohle und Kernkraft Lobby am russischen Angriffskrieg?
  • Eskalation - warum nukleare Stromerzeugung lebensbedrohlich ist
  • PeerTube 4.1 und Generelles über die Privatssphäre
  • Moderne Zeiten, Individuen & Gesellschaft
  • NFT und die Aufregung
  • Was ist Pipewire
  • Ich und die toxische Gesellschaft
  • Siebzehn Jahre hyperblog - Feiereialter Alter!
  • Agora Media - Diskurs der Demokratie
  • Teuflisch gute Rettung, die AVM FRITZ!Box 6660 Cable
  • Aggressoren auf der Love World Peace Parade in Berlin
  • Kommando zurück - Bash History Tipps
  • Apple - Altruismus oder knallhartes Geschäftsmodell?
  • Work-Life-Balance und die 4 Tage Woche - Eine Meinung
  • Linux Musikproduktion - Audio & Routing
  • Open Source Voice Assistants
  • Chia - Elektroschrott statt Energie
  • PoW, PoS und Zinsen bei Kryptowährungen
  • Du hast doch Ahnung von Computern - Support
  • Wohnungsenteignung
  • libinput & Mausgesten in KDE
  • KDE Mausklick "Problem"
  • Obsidian - Error file watchers
  • Der Weg ist am Ziel
  • Nextcloud 21 Update www-data Problem
  • Tutorial - BigBlueButton - Rundgang und ein einfacher Meeting Leitfaden
  • Fragen zu Artikeln oder Themen aus dem Blog
  • Digitale Währung, Stablecoin & Kryptowährung
  • Schöner aussehen mit Nanett
  • Low Latency für die Musikproduktion
  • Obsidian - Markdown your Power
  • Was sind dApps
  • Live online jammen mit SonoBus
  • Lieber '91 als '21
  • Das Sterben der Communities
  • Messenger Wechsel - Whatsapp wird zu Facebook
  • Audio und Video nachträglich synchronisieren in Sekunden
  • Internet Verkehrsnachrichten
  • Chaos Communication Congress 37C3 / C3One
  • Tutorial - Jamulus Client Installation unter Kubuntu 20.04
  • Multicore Compression bei Zip & Co
  • Tutorials, Videos und Musik
  • Dolphin - Konsole im aktuellen Pfad
  • Interessantes zu Video, Audio, Codecs, Container und Consorten
  • JACK Audio einfach mit KX Studio
  • Neuer Song: Habanera (Deluge) Odo Sendaidokai
  • Dein Video Tutorial Turbo - Firefox Youtube Addon
  • Zinsen im Jahre 2020 bekommen - Staking
  • Tutorial Firefox Suchmaschinen und Shortcuts ganz einfach
  • Friendica Hackathon 25.09.2020
  • Friendica 2020.09 Red Hot Poker ist fertig
  • Keine Panik - Digitalisierung von Schulen
  • ZDFinfo "Bitcoin Big Bang - 800 Millionen Dollar verschwinden"
  • Lasst die Profis ran - Party im Volkspark Hasenheide
  • Firefox beschleunigen - Grafik Chip nutzen
  • Friendica Worker - Vom CRON zum Daemon
  • Anleitung für eine nachhaltige und gesicherte Internet PR-Strategie
  • tmux ein Windowmanager für die Konsole
  • CPUfreq Plasma Widget für KDE
  • Warum Vorratsdatenspeicherung dumm ist
  • Timeshift Snapshot Tool
  • Aufarbeitung der Kritiken an Rezos Presse Video
  • youtube-dl unter Kubuntu 20.04 - Python Problem
  • Klimberli Deluge by Odo Sendaidokai
  • Favoriten im KDE Startmenü löschen
  • Spitfire Audio unter Linux
  • Tempelse
  • Für eine bessere Welt ohne Diskriminierung - Black Lives Matter !
  • LinVST - Windows VSTs einrichten
  • Rezos neues Video zu Verschwörungsmythen und der Presse
  • LinVST unter Wine für Bitwig compilieren
  • apt - Befehlsreferenz
  • Community, Influencer und Vampire

XML-Feeds

  • RSS 2.0: Beiträge
  • Atom: Beiträge
  • RDF: Beiträge
  • RSS 0.92: Beiträge
What is RSS?

XML-Feeds

  • RSS 2.0: Beiträge
  • Atom: Beiträge
  • RDF: Beiträge
  • RSS 0.92: Beiträge
What is RSS?

©2023 by Dem Sir hoergen • Kontakt • Hilfe • CMS + email marketing