Documentation Index
Fetch the complete documentation index at: https://docs.factagora.com/llms.txt
Use this file to discover all available pages before exploring further.
Fingerprint란?
Fingerprint는 Factagora의 콘텐츠 출처 증명 API입니다. 근본적인 문제를 해결합니다: 콘텐츠가 재작성되거나, 의역되거나, 번역된 이후에도 그것이 당신에게서 비롯되었다는 것을 어떻게 증명할 것인가? 기존의 텍스트 매칭 도구는 콘텐츠가 재구성되면 작동하지 않습니다. Fingerprint는 다르게 작동합니다, 콘텐츠의 인과 구조(누가 무엇을, 언제, 왜)를 분석하고 그 구조에 기반한 보이지 않는 워터마크를 삽입합니다. 모든 단어가 바뀌어도 그 아래의 구조는 여전히 탐지 가능합니다.작동 방식
삽입
/fingerprint/embed에 콘텐츠를 보냅니다. API가 시간 지식 그래프(TKG): 엔티티, 타임라인, 인과 관계, 논증 체인, 를 추출한 뒤, 그 구조에서 시드를 생성한 보이지 않는 zero-width 유니코드 워터마크를 삽입합니다. 배포할 워터마크가 적용된 콘텐츠를 반환받습니다.탐지
의심스러운 콘텐츠를 발견하면
/fingerprint/detect로 보냅니다. API는 두 가지 독립적인 검사를 실행합니다:- 워터마크 검사: 숨겨진 비트를 추출해 저장된 fingerprint와 상관관계를 계산합니다 (거의 확실한 일치)
- TKG 매칭: 단어 수준의 퍼지 매칭으로 인과 구조를 비교합니다 (의역 탐지)
주요 기능
의역에 강함
단어 수준의 퍼지 매칭 덕분에 “EU enacts AI Act”가 “European Union passed AI Act regulation”과 매치됩니다, 정확한 문자열 일치가 필요 없습니다.
이중 레이어 탐지
워터마크 상관관계(암호학적)와 TKG Jaccard(의미론적)가 독립적으로 실행됩니다. 두 가지가 동시에 발화하면 우연한 중복일 통계적 가능성이 거의 없습니다.
콘텐츠 유형 인식
점수 가중치가 자동으로 조정됩니다: 법률 문서는 인과 구조(0.6)에 가중을 두고, 뉴스는 엔티티(0.5)에 가중을 두며, 보고서는 세 신호를 균형 있게 반영합니다.
감사 가능한 증거
모든 매치에는 정확한 중복 목록, 공유된 엔티티, 타임라인, 인과 트리플, 이 포함되어 두 글이 왜 매치되었는지 설명할 수 있습니다.
TKG 스냅샷에 무엇이 담기나요?
콘텐츠에서 추출된 시간 지식 그래프(TKG)는 네 개의 레이어를 포함합니다:| 레이어 | 예시 | 목적 |
|---|---|---|
| Entities | Bank of Korea, Interest rate | 누가, 무엇이 관련되어 있는지 |
| Timeseries | 2024-03-15 | 이벤트가 언제 발생했는지 |
| Relations | Bank of Korea → raises → Interest rate | 무엇이 일어났는지 (원인과 결과) |
| Argument map | 전제 → 증거 → 결론 체인 | 왜 일어났는지 (거시적 추론) |
활용 사례
- 뉴스 기관: 출처 표기 없이 재게시된 기사를 탐지
- 법무 팀: 라이선싱 분쟁에서 콘텐츠 출처 증명
- 연구 기관: 연구 결과가 어떻게 인용되고 재사용되는지 추적
- 콘텐츠 플랫폼: 대규모로 잠재적인 콘텐츠 재사용을 자동으로 플래깅
다음 단계
Embed & Detect 워크스루
코드 예시와 함께 단계별 가이드를 제공합니다.
Best Practices
점수, 필터링, 감사를 위한 프로덕션 팁.

