Aktuelles
Aktuelles
Auf unserer Seite Videos finden Sie mehrere
YouTube-Kanäle unserer Mitglieder
Hier geht es zu unserem neuen FVC-Kanal
Autor: Hans Helei
Bitte unsere Datenschutzerklärung beachten!
Technischer Nachmittag über Künstliche Intelligenz
Z
um
Vortrag
über
Möglichkeiten
von
KI
in
der
Bild-
und
Audiobearbeitung
hat
der
Film-
und
Videoclub
Crailsheim
seine
Mitglieder
Ende
Januar
2025
eingeladen.
Neben
Mitgliedern
des
Crailsheimer
Filmclubs
waren
auch
Interessierte
vom
Filmclub
Ansbach
der Einladung gefolgt.
Referent
Benjamin
Krug
verstand
hervorragend,
den
Zuhörern
mit
Hilfe
einer
PowerPoint-Präsentationen
dieses
Thema
in
verständlicher
Form
näher
zu
bringen
und
erklärte
neben
der
Definition
die
verschiedenen
Begriffe
wie
Models,
Prompts
und Hardwareanforderungen.
Bei
der
Künstlichen
Intelligenz
(KI,
englisch
AI)
geht
es
darum,
Computern
beizubringen,
Aufgaben
zu
lösen,
die
normalerweise
menschliche
Intelligenz
erfordern.
KI
ist
nicht
in
der
Lage,
Emotionen
zu
fühlen
oder
subjektive
Erfahrungen
zu
machen
und
ist
sich
nicht
ihrer
selbst
bewusst.
In
den
1970er
Jahren
gab
es
die
ersten
Schachcomputer,
im
Jahr
1997
gewann ein IBM-Computer gegen den Schachweltmeister Kasparov.
Ein
Model
ist
ein
mit
Text,
Bildern,
Videos
oder
Audioaufnahmen
„gefütterte“
Datenbank
mit
einem
Algorithmus.
Der
Algorithmus
ist
in
der
Lage,
Muster
zu
erkennen
und
kann
bestimmte
Entscheidungen
ohne
zusätzliche
menschliche
Intervention
treffen.
Sie
sind
teilweise
frei
zugänglich
oder
werden
von
Unternehmen
kostenpflichtig
angeboten,
können
spezifisch,
generell
oder
mit
eigenen
Daten
erstellt
und
trainiert
werden.
AI-
Models
braucht
man
zum
Abfragen
von
Informationen
und
Zusammenfassen,
z.
B.
Suchmaschinen
oder
Sprachassistenten,
zum
Erstellen
von
Videos,
Audio,
Texten
oder
Bildern (Stimmverbesserung, Rauschunterdrückung, Hochskalierung).
Unter
„
Prompt
“
(engl.
„Aufforderung“)
versteht
man
die
Kommandozeile,
in
der
man
die
Beschreibung
des
Bildes,
des
Texts,
oder
des
Videos
eingibt,
welches
man
sehen
möchte.
Darin
müssen
in
normaler,
beschreibender
Sprache
alle
Informationen
enthalten
sein.
Weniger
Informationen
lassen
der
A.I.
mehr
Spielraum.In
einem
Beispiel
demonstrierte
der
Referent
auch,
wie
bei
verschiedenen
KI-Anwendung
(ChatGPT
und
Gemini) bei gleicher Fragestellung unterschiedliche Ergebnisse zustande kommen.
Für
die
Bild-
und
Videobearbeitung
gibt
es
derzeit
einige
Anwendungen,
um
Bilder
und
Videos zu entrauschen, nachzuschärfen und/oder hoch zu skalieren:
VideoAI,
Stable
Video
Diffusion,
Krea.AI,
Video2X,
Waifu2x,
Video
Enhancer
AI,
AVC
Video Enhancer AI, Topaz Photo AI und Video AI.
Auch
für
die
Audiobearbeitung
sind
verschiedene
Programme
wie
z.
B.
ElevenLabs,
Murf
AI,
Play.ht,
Lovo.ai,
Speechify,
Synthesys,
Google
TTS,
MS
Azure
TTS,
Amazon
Polly
erhältlich,
um
aus
Text
Stimmen
zu
erzeugen
(Text
to
Speech),
Störgeräusche
auszufiltern oder die Stimmlage anzupassen.
Auch
zur
Hardwareausstattung
des
Computers
hatte
der
Referent
Benjamin
Krug
Empfehlungen
mitgebracht,
damit
vernünftig
gearbeitet
werden
kann:
Als
Minimalausstattung
empfiehlt
er
einen
PC
mit
6-Kern
Prozessor
von
AMD
oder
Intel
mit
16GB
RAM,
eine
Nvidia
Geforce
RTX
4060
-
Grafikkarte
mit
8GB
und
eine
SSD-
Festplatte
mit
mindestens
100GB
freiem
Speicherplatz.Ohne
dezidierte
Grafikkarte
ist
keine
vernünftige
Bild-
bzw.
Videobearbeitung
möglich.
Je
mehr
Speicher
die
Karte
hat,
desto flüssiger erfolgt die Berechnung.