TY - CONF T1 - Confidence Regulation Neurons in Language Models JO - Advances in Neural Information Processing Systems PY - 2024/01/01 AU - Stolfo A AU - Wu B AU - Gurnee W AU - Belinkov Y AU - Song X AU - Sachan M AU - Nanda N ED - Y2 - 2025/03/03 ER -