ContextAssembler¶

Retrieval-to-injection bridge — assembles LLM-ready context within token budgets by orchestrating pull-path (query-driven) and push-path (proactive surfacing) retrieval across all Popoto memory primitives.

Overview¶

ContextAssembler provides a single assemble() call that:

Pull path: ExistenceFilter pre-check -> CompositeScoreQuery -> CoOccurrence propagation
Push path: CyclicDecayField temporal scan above surfacing threshold
Merge: Deduplicate, re-rank, budget-select, post-effects, format

Primitive Synergy¶

Primitive	Role in ContextAssembler
DecayingSortedField	Score index for CompositeScoreQuery
CyclicDecayField	Push-path proactive surfacing
ConfidenceField	Score index + competitive suppression
CoOccurrenceField	Pull-path candidate expansion
ExistenceFilter	Pull-path pre-check (skip if absent)
AccessTrackerMixin	on_read post-effect tracking
ObservationProtocol	on_read / on_surfaced dispatch
RecallProposal	Created for push-path records
WriteFilterMixin	Priority score in composite
EventStreamMixin	Mutation logging (via model save)
PredictionLedgerMixin	Outcome tracking (via model save)
CompositeScoreQuery	Multi-factor ranked retrieval

Usage¶

from popoto.recipes.context_assembler import ContextAssembler

assembler = ContextAssembler(
    model_class=Memory,
    score_weights={"relevance": 0.6, "confidence": 0.3},
    max_items=10,
    max_tokens=4000,
)

result = assembler.assemble(
    query_cues={"topic": "deployment"},
    agent_id="agent-1",
)

# result.records — selected instances
# result.proactive — push-path subset
# result.formatted — LLM-ready string
# result.metadata — scores, timing, token counts

AssemblyResult¶

The assemble() call returns an AssemblyResult dataclass:

Field	Type	Description
`records`	`list`	Selected model instances, ranked
`proactive`	`list`	Subset of records from push-path
`formatted`	`str`	LLM-ready formatted string
`metadata`	`dict`	Scores, timing, token counts

Tuning Constants¶

from popoto.fields.constants import Defaults

Constant	Default	Optimal Range	Description
`COMPETITIVE_SUPPRESSION_SIGNAL`	0.3	[0.1, 0.7]	Signal for suppressing non-selected pull-path candidates
`DEFAULT_SURFACING_THRESHOLD`	0.5	[0.1, 0.9]	Minimum score for push-path records

Additional non-tunable defaults:

Constant	Default	Description
`DEFAULT_MAX_ITEMS`	10	Maximum records returned
`DEFAULT_PROPAGATION_DEPTH`	2	BFS depth for CoOccurrence propagation

Pipeline Details¶

Pull Path¶

ExistenceFilter pre-check: Skip query entirely if no matching topics exist (O(1)).
CompositeScoreQuery: Multi-factor ranked retrieval combining decay scores, confidence, and priority weights.
CoOccurrence propagation: BFS expansion from seed records to find associatively related memories.

Push Path¶

CyclicDecayField scan: Find records whose cyclic + pressure score exceeds DEFAULT_SURFACING_THRESHOLD.
RecallProposal creation: Track surfaced records via ObservationProtocol.on_surfaced().

Merge and Budget¶

Deduplicate: Records appearing in both paths are kept once.
Re-rank: Combined score from both paths.
Budget-select: Fit within max_items and max_tokens constraints.
Post-effects: Fire ObservationProtocol.on_read() for selected records.
Competitive suppression: Non-selected pull-path candidates receive a mild contradiction signal via ConfidenceField.

LLM Integration¶

Wire assembled context into an LLM call using the OpenAI SDK v1+:

from openai import OpenAI
from popoto import ContextAssembler, ObservationProtocol

client = OpenAI()  # uses OPENAI_API_KEY env var

assembler = ContextAssembler(
    model_class=Memory,
    score_weights={"relevance": 0.6, "confidence": 0.3},
    max_items=10,
    max_tokens=4000,
)

result = assembler.assemble(
    query_cues={"topic": "deployment"},
    agent_id="agent-1",
)

# Build messages with injected memory context
messages = [
    {"role": "system", "content": f"You are a helpful assistant.\n\nRelevant context:\n{result.formatted}"},
    {"role": "user", "content": "What's our deployment strategy?"},
]

# Call the LLM
response = client.chat.completions.create(
    model="gpt-4.1-nano",
    messages=messages,
)

answer = response.choices[0].message.content

# Report outcomes — which memories did the agent actually use?
outcome_map = {r.db_key.redis_key: "acted" for r in result.records}
ObservationProtocol.on_context_used(result.records, outcome_map)

Retrieval Quality Scoring¶

To score the quality of a retrieval — avg confidence, feeling-of-knowing, score spread, staleness — pass assess_quality=True to assemble() or call the standalone assess() probe before retrieval:

# Pre-retrieval probe (cheap — no propagation, no push path)
quality = assembler.assess({"topic": "deployment"})
if quality.fok_score < 0.3:
    return  # skip retrieval; memory store has nothing relevant

# Post-retrieval quality attached to metadata
result = assembler.assemble({"topic": "deployment"}, assess_quality=True)
quality = result.metadata["quality"]  # RetrievalQuality dataclass
print(quality.avg_confidence, quality.fok_score)

See Metacognitive Layer for full documentation of RetrievalQuality, all four metrics, the assess() method, and the AdaptiveAssembler keep/revert loop.