awesome-generative-ai

📈 Generative AI & LLM APIs

Comprehensive collection of Generative AI and Large Language Model APIs for text generation, image creation, and multimodal applications.

📋 Table of Contents

🤖 LLM APIs
🖼️ Image Generation APIs
🎵 Audio & Speech APIs
🔧 Development Tools

🤖 LLM APIs

🔷 OpenAI

GPT-4 - Advanced language model
GPT-3.5 Turbo - Cost-effective option
DALL-E 3 - Text-to-image generation
Whisper - Speech-to-text transcription
TTS - Text-to-speech synthesis

🔷 Anthropic

Claude 3 - Advanced reasoning capabilities
Claude 3.5 Sonnet - Balanced performance
Claude 3 Haiku - Fast and efficient
Claude 3 Opus - Most capable model

🔷 Google

Gemini Pro - Multimodal capabilities
Gemini Flash - Fast and efficient
PaLM 2 - Large language model
Vertex AI - Enterprise platform

🔷 Meta

Llama 2 - Open-source foundation
Code Llama - Code generation
Llama 3 - Latest iteration

🖼️ Image Generation APIs

🔷 Stability AI

Stable Diffusion - Open-source image generation
DreamStudio - Web-based interface
API Access - Programmatic generation
Custom Models - Fine-tuned versions

🔷 Midjourney

High-quality artistic generation
Discord integration for easy access
Style consistency across generations
Commercial licensing available

🔷 Adobe

Firefly - Creative suite integration
Generative Fill - Photoshop integration
Text Effects - Typography generation
Vector Graphics - Scalable artwork

🎵 Audio & Speech APIs

🔷 ElevenLabs

Voice Cloning - Realistic voice synthesis
Text-to-Speech - High-quality audio
Voice Design - Custom voice creation
API Access - Programmatic control

🔷 Azure Speech

Speech-to-Text - Real-time transcription
Text-to-Speech - Natural voice synthesis
Speech Translation - Real-time translation
Speaker Recognition - Voice identification

🔷 AWS Polly

Neural TTS - High-quality synthesis
SSML Support - Advanced speech control
Multiple Voices - Diverse language support
Real-time Streaming - Low-latency output

🔧 Development Tools

🔷 Hugging Face

Transformers - Model library
Inference API - Easy model access
Spaces - Model deployment
Datasets - Training data

🔷 LangChain

LLM Integration - Framework for applications
Prompt Management - Template system
Memory Systems - Conversation context
Tool Integration - External API connections

🔷 OpenAI SDK

Python Library - Easy API integration
TypeScript Support - JavaScript/Node.js
Streaming - Real-time responses
Function Calling - Structured outputs

💡 Implementation Examples

Python - OpenAI API

import openai

# Configure API
openai.api_key = "your-api-key"

# Generate text
response = openai.ChatCompletion.create(
    model="gpt-4",
    messages=[
        {"role": "user", "content": "Explain quantum computing in simple terms"}
    ]
)

print(response.choices[0].message.content)

Python - Image Generation

import requests

# Generate image with DALL-E
response = requests.post(
    "https://api.openai.com/v1/images/generations",
    headers={"Authorization": f"Bearer {api_key}"},
    json={
        "prompt": "A futuristic cityscape at sunset",
        "n": 1,
        "size": "1024x1024"
    }
)

image_url = response.json()["data"][0]["url"]

Python - Speech Synthesis

import requests

# ElevenLabs TTS
response = requests.post(
    "https://api.elevenlabs.io/v1/text-to-speech/voice_id",
    headers={"xi-api-key": api_key},
    json={
        "text": "Hello, this is AI-generated speech!",
        "model_id": "eleven_monolingual_v1"
    }
)

# Save audio file
with open("output.wav", "wb") as f:
    f.write(response.content)

STT Models - Speech-to-text recognition
TTS Models - Text-to-speech synthesis
Text-to-Image - Image generation
Voice Cloning - Voice synthesis

💡 Use Cases

Application	API Type	Benefits
Chatbots	LLM APIs	Natural conversations
Content Creation	Text + Image APIs	Automated generation
Voice Assistants	Speech APIs	Audio interaction
Data Analysis	LLM APIs	Insight generation
Creative Tools	Multimodal APIs	Artistic applications

⚖️ Best Practices

🔒 API Management

Rate limiting - Respect API quotas
Error handling - Graceful failure management
Cost optimization - Efficient usage patterns
Security - Secure API key management

🚀 Performance Tips

Caching - Store frequent responses
Batching - Combine multiple requests
Streaming - Real-time processing
Async processing - Non-blocking operations

💡 Tip: Start with free tiers to experiment, then scale up based on your specific needs and usage patterns.

This site is open source. Improve this page.

awesome-generative-ai

📈 Generative AI & LLM APIs

📋 Table of Contents

🤖 LLM APIs

🔷 OpenAI

🔷 Anthropic

🔷 Google

🔷 Meta

🖼️ Image Generation APIs

🔷 Stability AI

🔷 Midjourney

🔷 Adobe

🎵 Audio & Speech APIs

🔷 ElevenLabs

🔷 Azure Speech

🔷 AWS Polly

🔧 Development Tools

🔷 Hugging Face

🔷 LangChain

🔷 OpenAI SDK

💡 Implementation Examples

Python - OpenAI API

Python - Image Generation

Python - Speech Synthesis

🔗 Related Resources

💡 Use Cases

⚖️ Best Practices

🔒 API Management

🚀 Performance Tips