Detectar Copilot en tests de programación take-home | HRBlade Blog

Los tests de programación take-home fueron el gold standard de la contratación de ingeniería durante una década. Luego pasaron GPT-4 y Copilot. Ahora cualquiera puede entregar una solución pasable a un take-home típico en una tarde — incluso si en realidad no sabe programar.

La detección anti-IA más reformular el formato del test es como los equipos mantienen la señal honesta. La detección pura no puede ser toda la respuesta — los falsos positivos son demasiado caros. Pero capada con cambios de formato, puedes mantener los take-homes útiles.

Defensa por capas

Primero, señales de comportamiento: cadencia de tipeo, patrones de edición, eventos de paste, distribución de tiempo en la tarea. Los envíos asistidos por IA se ven diferentes a los escritos por humanos. La precisión de detección en nuestro benchmark está en el 94 %, con tasa de falso positivo <2 %.

Segundo, cambio de formato: pasa de 'implementa X' a 'revisa y mejora este codebase'. La IA es mala depurando código no familiar, especialmente con problemas arquitecturales sutiles. Los ingenieros reales pueden hacerlo; los candidatos asistidos por LLM se atascarán.

Tercero, walkthrough en vivo de seguimiento: llamada de 30 minutos donde el candidato explica su solución. Cualquiera que de verdad la haya escrito puede hablar con fluidez sobre tradeoffs; los candidatos asistidos por LLM no pueden.