ai-tax-agent/TESTPLAN.md at main

harkon b324ff09ef

CI/CD Pipeline / Code Quality & Linting (push) Has been cancelled

Details

CI/CD Pipeline / Policy Validation (push) Has been cancelled

Details

CI/CD Pipeline / Test Suite (push) Has been cancelled

Details

CI/CD Pipeline / Build Docker Images (svc-coverage) (push) Has been cancelled

Details

CI/CD Pipeline / Build Docker Images (svc-extract) (push) Has been cancelled

Details

CI/CD Pipeline / Build Docker Images (svc-firm-connectors) (push) Has been cancelled

Details

CI/CD Pipeline / Build Docker Images (svc-forms) (push) Has been cancelled

Details

CI/CD Pipeline / Build Docker Images (svc-hmrc) (push) Has been cancelled

Details

CI/CD Pipeline / Build Docker Images (svc-ingestion) (push) Has been cancelled

Details

CI/CD Pipeline / Build Docker Images (svc-kg) (push) Has been cancelled

Details

CI/CD Pipeline / Build Docker Images (svc-normalize-map) (push) Has been cancelled

Details

CI/CD Pipeline / Build Docker Images (svc-ocr) (push) Has been cancelled

Details

CI/CD Pipeline / Build Docker Images (svc-rag-indexer) (push) Has been cancelled

Details

CI/CD Pipeline / Build Docker Images (svc-rag-retriever) (push) Has been cancelled

Details

CI/CD Pipeline / Build Docker Images (svc-reason) (push) Has been cancelled

Details

CI/CD Pipeline / Build Docker Images (svc-rpa) (push) Has been cancelled

Details

CI/CD Pipeline / Build Docker Images (ui-review) (push) Has been cancelled

Details

CI/CD Pipeline / Security Scanning (svc-coverage) (push) Has been cancelled

Details

CI/CD Pipeline / Security Scanning (svc-extract) (push) Has been cancelled

Details

CI/CD Pipeline / Security Scanning (svc-kg) (push) Has been cancelled

Details

CI/CD Pipeline / Security Scanning (svc-rag-retriever) (push) Has been cancelled

Details

CI/CD Pipeline / Security Scanning (ui-review) (push) Has been cancelled

Details

CI/CD Pipeline / Generate SBOM (push) Has been cancelled

Details

CI/CD Pipeline / Deploy to Staging (push) Has been cancelled

Details

CI/CD Pipeline / Deploy to Production (push) Has been cancelled

Details

CI/CD Pipeline / Notifications (push) Has been cancelled

Details

Initial commit

Field Type	Precision Target	Recall Target	Notes
Currency amounts	≥ 0.98	≥ 0.96	Critical for calculations
Dates	≥ 0.95	≥ 0.94	Tax year assignment
Party names	≥ 0.90	≥ 0.88	Entity resolution
Reference numbers	≥ 0.92	≥ 0.90	UTR, NI, VAT validation
Addresses	≥ 0.85	≥ 0.80	Postcode validation

9.1 KiB Raw Permalink Blame History

Datasets, Metrics, Acceptance Criteria

Test Datasets

Synthetic Data

Anonymized Real-like Data

Golden Reference Sets

Extraction Metrics

Field-Level Precision/Recall

Document Classification

Schedule-Level Accuracy

Absolute Error Targets

Reconciliation Pass-Rate

RAG Retrieval Evaluation

Retrieval Metrics

Faithfulness & Groundedness

RAG-Specific Tests

Explanation Coverage

Lineage Traceability

Calculation Explanations

Security & Compliance Tests

Authentication & Authorization

Data Protection

GDPR Compliance

Red-Team Test Cases

Adversarial Inputs

System Resilience

Privacy Attacks

Performance Benchmarks

Throughput Targets

Latency SLOs

Acceptance Criteria

Functional Requirements

Non-Functional Requirements

Integration Requirements

Test Execution Strategy

Unit Tests

Integration Tests

Performance Tests

Security Tests

Continuous Monitoring

Quality Metrics Dashboard

Alerting Thresholds

Model Retraining Triggers

9.1 KiB

Raw Permalink Blame History