Glossar#
- Access Token#
Ein Zugriffstoken (Access Token) ist eine spezielle Art von Sicherheitstoken, das einem Benutzer oder einer Anwendung Zugriff auf bestimmte Ressourcen gewährt und häufig in Authentifizierungsprotokollen wird.
- Anaconda#
Anaconda ist eine umfassende Open-Source-Plattform für Data Science und maschinelles Lernen, die eine große Auswahl an Werkzeugen und Bibliotheken wie Python, R und Jupyter Notebooks in einem einfach zu installierenden Paket bietet.
- API#
Ein Application Programming Interface ist eine Programmierschnittstelle über die Daten ausgetauscht werden können oder die eine Anbindung an eine andere Software ermöglicht.
- API Key#
Ein API Key ist eine spezielle Art von Sicherheitstoken, das einem Benutzer oder einer Anwendung Zugriff auf bestimmte Ressourcen gewährt und häufig in Authentifizierungsprotokollen wird.
- Attribute#
Attribute in Python sind Informationen, die einem Objekt zugeordnet sind und seine Eigenschaften oder Zustände beschreiben.
- bin#
Ein bin im Zusammenhang mit Histogrammen bezieht sich auf die diskreten Intervalle, in die die Daten im Histogramm gruppiert werden, um die Verteilung der Daten zu visualisieren.
- Binder#
Mit Binder können Notebooks, die in einem Git-Repository hinterlegt sind, als ausführbare Notebooks genutzt werden. Binder stellt die notwendigen Serverkapazität kostenfrei zur Verfügung.
- booleschen Maskierung#
Boolesche Maskierung ist ein Verfahren, bei dem eine boolesche Bedingung auf eine Datenstruktur angewendet wird, um Werte auszuwählen oder zu filtern, die der Bedingung entsprechen.
- Conda#
Conda ist ein Paketmanager für Python, der das Erstellen, Verwalten und Verteilen von Paketen sowie die Erstellung von virtuellen Umgebungen zur Isolierung von Projektabhängigkeiten ermöglicht.
- Dataframes#
Ein Pandas DataFrame ist eine zweidimensionale Datenstruktur in Python, die Daten in tabellarischer Form organisiert und zahlreiche Funktionen für die Datenmanipulation und -analyse bietet.
- Endpoint#
Ein API-Endpoint ist eine spezifische URL, die von einer API bereitgestellt wird, um Anfragen entgegenzunehmen und Antworten zurückzugeben, um bestimmte Funktionen oder Ressourcen zu erhalten.
- explorative Datenanalyse#
Explorative Datenanalyse ist ein Ansatz zur Untersuchung von Daten, um Muster, Trends und Beziehungen zu entdecken und Einblicke zu gewinnen, bevor formale statistische Modelle angewendet werden.
- HTML#
HTML (Hypertext Markup Language) ist eine Auszeichnungssprache zur Strukturierung von Webinhalten mithilfe von Tags, um deren semantische Bedeutung zu definieren und sie im Webbrowser darzustellen.
- JSON#
JSON (JavaScript Object Notation) ist ein leichtgewichtiges Datenaustauschformat, das menschenlesbar ist und häufig in der Webentwicklung verwendet wird, um strukturierte Daten zwischen Client und Server zu übertragen.
- Kommandozeile#
Die Kommandozeile ist eine textbasierte Benutzerschnittstelle, die es ermöglicht, Befehle direkt an das Betriebssystem zu senden und Aufgaben durch Eingabe von Textbefehlen auszuführen.
- Literalen#
Ein Literal ist eine direkte Darstellung eines Wertes innerhalb eines Programmcodes, der nicht durch eine Variable oder eine andere Ausdrucksform repräsentiert wird.
- Live Code#
Die Codeblöcke im Jupyterbook können direkt im Live Code ausgeführt werden. Dies ermöglicht das Tool Thebe, welches im Hintergrund auf -> Binder zugreift. Der Live Code Modus kann über das Raketensymbol aufgerufen werden.
- NANs#
NaN (Not a Number) ist ein spezieller Wert, der in vielen Programmiersprachen verwendet wird, um anzugeben, dass ein fehlender oder undefinierter numerische Wert vorhanden ist.
- mergen#
Mergen ist der Prozess, bei dem zwei oder mehr separate Datenstrukturen zusammengeführt werden, um eine einzige, kombinierte Struktur zu erstellen, wobei vorhandene Elemente aktualisiert oder neue hinzugefügt werden.
- Paketverwaltungsprogramm#
Ein Paketverwaltungsprogramm ist eine Software, die die Installation, Aktualisierung und Entfernung von Softwarepaketen auf einem Computersystem automatisiert und verwaltet.
- Parameter#
Ein Parameter ist eine Variable in einer Funktion oder Methode, die Werte akzeptiert, die der Funktion übergeben werden können, um ihr Verhalten oder Ergebnis zu beeinflussen.
- parsen#
Parsen ist der Prozess des Analysierens oder Interpretierens von strukturierten Daten gemäß einer bestimmten Syntax, um sie in eine für die weitere Verarbeitung geeignete Form zu bringen.
- PIP#
PIP ist ein Paketmanager für Python, der die Installation, Aktualisierung und Verwaltung von Python-Paketen und deren Abhängigkeiten erleichtert.
- Reguläre Ausdrücke#
Reguläre Ausdrücke sind spezielle Zeichenfolgenmuster, die verwendet werden, um Texte basierend auf vordefinierten Kriterien oder Regeln zu durchsuchen, zu extrahieren oder zu manipulieren.
- Series#
Eine Pandas Series ist eine eindimensionale Datenstruktur in Python, die eine geordnete Sequenz von Werten mit einem zugehörigen Index darstellt.
- Server#
Ein Server ist ein Computer oder eine Software, die auf Anfragen reagiert und Dienste oder Ressourcen bereitstellt, wie das Bereitstellen von Webseiten, Datenbankzugriff oder das Hosting von Anwendungen.
- Statuscode#
Ein Statuscode ist eine numerische Kennung, die von einem Server an einen Client zurückgegeben wird, um den Erfolg oder das Scheitern einer HTTP-Anfrage anzugeben und weitere Informationen über den Status der Anfrage zu liefern.
- Stoppwörter#
Stoppwörter sind häufig vorkommende Wörter wie “und”, “oder” und “aber”, die in der Textverarbeitung oft ignoriert werden, da sie wenig zur Bedeutung des Textes beitragen.
- Tags#
Tags sind spezielle Textelemente in Auszeichnungssprachen wie HTML oder XML, die verwendet werden, um den Inhalt zu strukturieren und zu formatieren, indem sie dem Text semantische Bedeutung verleihen und ihn für die Darstellung im Browser oder die Verarbeitung durch Software definieren.
- Terminal#
Ein Terminal ist eine textbasierte Benutzerschnittstelle, die es ermöglicht, Befehle direkt an das Betriebssystem zu senden und Ergebnisse anzuzeigen.
- Third-Party-Packages#
Third-Party-Packages sind Softwarepakete oder Bibliotheken, die von externen Entwicklern erstellt und nicht Teil der Standardbibliothek der verwendeten Programmiersprache sind.
- Token#
In Natural Language Processing (NLP) ist ein Token eine atomare Einheit, die während der Textverarbeitung gebildet wird und einem Wort, einer Zahl, einem Satzzeichen oder einer anderen Bedeutungseinheit entspricht, um den Text in kleinere Teile zu zerlegen und weiter zu analysieren.
- URI#
Eine URI (Uniform Resource Identifier) ist eine Zeichenfolge zur Identifizierung oder Lokalisierung einer Ressource, sei es im Web oder in anderen Kontexten, und sie besteht aus einem Schema, einem optionalen Autoritätsabschnitt und einem Pfad, der die Position der Ressource angibt.
- URL#
Eine URL (Uniform Resource Locator) ist eine spezielle Art von URI, die eine eindeutige Adresse für eine Ressource im Internet angibt, wobei sie das Protokoll, die Domäne, den Pfad und optional weitere Informationen wie Portnummer oder Abfrageparameter enthält, um auf die Ressource zuzugreifen.
- XML#
XML (eXtensible Markup Language) ist eine Auszeichnungssprache, die dazu dient, strukturierte Daten zu definieren und zu kennzeichnen, indem sie den Inhalt in markierte Elemente mit benutzerdefinierten Tags unter Verwendung einer hierarchischen Syntax gliedert, was häufig für den Austausch von Daten zwischen verschiedenen Systemen verwendet wird.