Metadata-Version: 2.3
Name: onedevcommonfileextractor
Version: 1.0.7
Summary: Ferramenta para extração de conteúdo de arquivos
Author: Renan
Author-email: renan.cardeal@ufly.com.br
Requires-Python: >=3.13,<4.0
Classifier: Programming Language :: Python :: 3
Classifier: Programming Language :: Python :: 3.13
Requires-Dist: Pillow (>=10.2.0,<11.0.0)
Requires-Dist: PyMuPDF (>=1.24.0,<2.0.0)
Requires-Dist: chromadb (==0.5.18)
Requires-Dist: cryptography (>=44.0.0,<45.0.0)
Requires-Dist: grpcio (>=1.68.1,<2.0.0)
Requires-Dist: grpcio-tools (>=1.68.1,<2.0.0)
Requires-Dist: langchain (>=0.3.20,<0.4.0)
Requires-Dist: langchain-chroma (>=0.2.2,<0.3.0)
Requires-Dist: langchain-google-genai (>=2.0.11,<3.0.0)
Requires-Dist: langgraph (>=0.3.6,<0.4.0)
Requires-Dist: oci (>=2.141.0,<3.0.0)
Requires-Dist: opencv-python (>=4.9.0,<5.0.0)
Requires-Dist: openpyxl (>=3.1.5,<4.0.0)
Requires-Dist: pandas (>=2.2.3,<3.0.0)
Requires-Dist: pycryptodome (>=3.21.0,<4.0.0)
Requires-Dist: pytesseract (>=0.3.10,<0.4.0)
Requires-Dist: python-dotenv (>=1.0.1,<2.0.0)
Requires-Dist: requests (>=2.32.3,<3.0.0)
Requires-Dist: sendgrid (>=6.11.0,<7.0.0)
Requires-Dist: xlsxwriter (>=3.2.0,<4.0.0)
Description-Content-Type: text/markdown

# Library Content File Extractor

Extrator de conteúdo de arquivos com suporte a PDFs e integração com APIs de IA (Google Gemini e Azure OpenAI).

## Pré-requisitos

- Python 3.8+
- Poetry (para gerenciamento de dependências)

## Instalação

1. Instalação da Biblioteca
```bash
pip install onedevcommonfileextractor
```
ou, se estiver usando poetry
```bash
poetry add onedevcommonfileextractor
```

## Configuração das Variáveis

Ao instanciar a classe `ExtractorFile`, é necessário passar como parâmetro algumas configurações em `config: ConfigAI`.

### Variáveis Obrigatórias

| Variável | Descrição | Exemplo |
|----------|-----------|---------|
| `GOOGLE_API_KEY` | Chave da API Google Gemini | `your_google_api_key_here` |
| `OPENAI_API_URL` | URL da API Azure OpenAI | `https://your-resource.openai.azure.com` |
| `OPENAI_API_KEY` | Chave da API Azure OpenAI | `your_azure_openai_api_key_here` |
| `ENVIRONMENT` | Ambiente de execução | `development`, `production` |

### Obtenção das Chaves de API

- **Google API Key**: Acesse o [Google Cloud Console](https://console.cloud.google.com/) e habilite a API Gemini
- **Azure OpenAI**: Configure no [Azure Portal](https://portal.azure.com/) e obtenha as credenciais necessárias

## Uso

### Após a instalação da biblioteca instancie a classe `ExtractorFile`:

```bash
config = ConfigAI()
config.AZURE_API_VERSION = ""
config.AZURE_DEPLOYMENT_NAME = ""
config.AZURE_OPENAI_API_KEY = ""
config.AZURE_OPENAI_API_URL = ""
config.GOOGLE_API_KEY = ""
 
extractor = ExtractorFile(config)
```

### Executar a funcionalidade. 
## Para executar a funcionalidade usar o método `run`, com os parâmetros para a sua execução.

```bash
result = extractor.run(
    task_id=None,
    use_ai=True,
    ai_provider='google',
    extract_insurance_data=True,
    file_path=""
)

print(result)
```

## Funcionalidades

- Extração de conteúdo de PDFs
- Processamento com IA (Google Gemini e Azure OpenAI)
- Geração de saída em JSON
- Armazenamento seguro de dados
- Criptografia de informações sensíveis

## Licença

Este projeto está sob a licença [MIT](LICENSE).
