| Seguimiento (monitoreo) de programas 1. Propósitos principales del seguimiento  El seguimiento de programas tiene dos
        propósitos principales: 
          mejorar los programas identificando aquellos
            aspectos que están trabajando de acuerdo a un plan y aquellos que deben ser corregidos a
            mitad de curso y rastrear los resultados a nivel de programa o
            de población Por ejemplo, ciertas técnicas de evaluación
        están diseñadas específicamente para mejorar el desempeño. En un esfuerzo para mejorar
        la calidad de la atención en los programas de planificación familiar, ciertos países
        han experimentado con la técnica Client-Oriented Provider-Efficient (COPE) o técnica de
        provisión eficiente orientada hacia el cliente, que es un instrumento de autovaloración
        diseñada para uso local, es decir en cada PPS (AVSC International, 1995). Los datos no se
        agregan a un nivel superior, sino que más bien se analizan por los proveedores de
        servicios para identificar cambios que puedan ocurrir a nivel local y dirigirse a
        problemas identificados por el ejercicio. Esta técnica cualitativa representa un enfoque
        promisor para mejorar los programas de abajo hacia arriba, pero no satisface las
        necesidades de un oficial regional de programa en el rastreo de resultados de los PPS en
        una red de establecimientos. Por otra parte, hay técnicas que dan
        seguimiento a los logros de un programa pero proveen una percepción relativamente pobre
        de las bondades y las debilidades. Un ejemplo sería la rutina que reporta las
        estadísticas de servicios (por ejemplo, el número de visitas prenatales, número de
        partos) recolectadas a nivel de los PPS y agregadas a nivel central. Este tipo de
        información es valiosa para el rastreo de las tendencias a través del tiempo, pero por
        sí solas no indican por qué el programa está o no está logrando los resultados
        deseados. Los administradores de programas y agencias
        donantes están generalmente interesados en ambos tipos de seguimiento. Las agencias
        donantes casi siempre quieren los datos cuantitativos sobre "resultados", pero
        están cada vez más interesados en que el programa tenga algunos medios para obtener
        datos, a menudo cualitativos en naturaleza (por ejemplo, grupos focales, entrevistas en
        profundidad, listas de chequeo de observación, etc.), los cuales serán usados
        directamente para mejorar el programa. En estas circunstancias, el seguimiento y control
        de programas a menudo consiste en una combinación de actividades de evaluación
        cuantitativas y cualitativas sobre resultados y procesos del programa. Las evaluaciones concentran cada vez más su
        atención en el efecto final de los programas de planificación familiar y salud, o sea,
        en el impacto de los programas o las intervenciones. La medición del impacto comprende
        más que el mero seguimiento de los cambios en los indicadores de resultados, requiere una
        evidencia empírica de que un cambio observado en los indicadores de resultados es
        atribuible a un determinado programa o intervención. En otras palabras, requiere
        evidencia de que el programa o la intervención evaluada ha causado el cambio. Para medir el impacto del programa están disponibles cierta cantidad de
        métodos y enfoques. Estos difieren en distintos aspectos, como por ejemplo, el número y
        tipo de supuestos, la solidez de las conclusiones alcanzadas sobre el impacto del programa
        y los requisitos operacionales y de datos. Este capítulo ofrece una visión de conjunto
        de los métodos más robustos disponibles para medir el impacto de programas de salud
        reproductiva, con el objetivo de ofrecer una guía para seleccionar la mejor opción. Las decisiones sobre cómo debería medirse el impacto del programa se
        deben hacer en la etapa del diseño o del planeamiento de los programas o nuevos ciclos de
        programas, porque es solo en esta etapa que se tienen disponibles todas las opciones. Una
        vez que un programa o ciclo de programas está funcionando, se pierde la oportunidad de
        usar algunos de los diseños de investigación más poderosos y se vuelve necesario
        recurrir a opciones más débiles.  2. Identificación de los elementos que deben
        tener seguimiento  La decisión sobre cuáles componentes de un
        programa deben tener seguimiento depende, en parte, del propósito primario de la
        evaluación: mejorar el programa, rastrear los resultados o ambos. Para el administrador
        del programa, no se trata de "uno u otro", requiere ambos. Por el contrario, las
        agencias donantes están a menudo más interesadas en rastrear los resultados a nivel de
        programa (aunque también fomentan la adopción de mecanismos para identificar áreas que
        requieren mejoramiento). La evaluación de las diferentes operaciones de
        los servicios ("áreas funcionales") es particularmente útil cuando se realiza
        con suficiente antelación en el proceso de implementación para permitir correcciones a
        mitad de curso. La utilización del servicio está generalmente rastreada continuamente
        durante la vida del proyecto. Los productos, por el contrario, están medidos generalmente
        en intervalos (dos o más) para medir el cambio a través del tiempo. Ciertos puntos deben ser mencionados: 
          El seguimiento de programas emplea tanto las técnicas
            cuantitativas como cualitativas.No es práctico intentar una evaluación detallada de TODOS los
            aspectos del programa. Más bien, es importante priorizar aquellos puntos para los cuales
            la información será más útil para la organización y crucial para el éxito del
            programa. El uso de un marco conceptual que identifica los caminos para
            lograr los resultados deseados es conveniente tanto en proyectos como en programas
            nacionales. Las actividades de evaluación son generalmente escalonadas.
            Algunas pueden ser realizadas de rutina (por ejemplo, recolección e informes de
            estadísticas de servicios), otras sobre una base periódica (por ejemplo, simulaciones y
            encuestas de observadores incógnitos para valorar la calidad de la atención) y otras
            consisten en un solo ejercicio. El personal administrativo clave debería tomar el papel de
            líder en la decisión de a cuáles aspectos del programa dar seguimiento. Esto no lo debe
            hacer el especialista en evaluación. Es importante, sin embargo, que el especialista en
            evaluación se involucre bastante en estas discusiones, para proveer información útil
            para influenciar la decisión (por ejemplo, los costos y el tiempo requeridos para
            diferentes actividades de recolección de datos, las fuentes alternativas de información,
            los sesgos inherentes a distintos métodos de recolección de datos, etc.). La tarea es, entonces, identificar las preguntas
        de evaluación prioritarias para el programa en estudio. Por ejemplo, casi todos los
        administradores querrán retroalimentación regular sobre "resultados" que
        reflejen el desempeño a nivel de establecimiento (número de partos por cesárea, número
        de inmunizaciones de tétanos). A menudo hay, también, puntos específicos de interés a
        los cuales dirigirse (por ejemplo, la necesidad de dar seguimiento a la calidad). Los
        administradores también querrán saber cuán productivo es su personal administrativo en
        la generación de productos tales como atención de clientes: ¿cuántos clientes reciben
        servicios diariamente? ¿Cuál fue el costo de proveer parteras entrenadas para los partos
        del año anterior? 3.  Indicadores Propósito de los indicadores Los indicadores miden diferentes aspectos de un
        programa: los insumos, los procesos, los productos y los resultados. A un indicador se le
        puede asignar un valor numérico (porcentaje, promedio, una jerarquía, valor absoluto) o
        un valor de si/no (por ejemplo, "presencia" versus "ausencia"). En
        algunos casos, el valor tiene una interpretación muy amplia (por ejemplo, la tasa de
        mortalidad materna de 948 por 100,000 en la República Central Africana para un período
        de 10 a 13 años puede ser percibida como "alta" (DHS Fact Sheets. 1994/95)). En
        otros casos, el valor (número) es más útil en un sentido relativo, en comparación con
        programas similares o con el mismo programa en una fecha anterior (por ejemplo, tendencias
        en inmunizaciones de tétanos). Una lista completa de indicadores está
        publicada en el documento (disponible solo en inglés) "Indicadores para la
        Evaluación de Programas de Salud Reproductiva: Informe Final del Subcomité sobre
        Embarazo Seguro" (Bertrand y Tsui, 1995). Para una evaluación dada, se debe priorizar los
        indicadores con base en objetivos específicos del programa específicos y seleccionar un
        conjunto manejable de indicadores para satisfacer las necesidades específicas de la
        situación. En resumen, es esencial identificar la(s) pregunta(s) clave(s) a la(s)
        cual(es) se dirige la evaluación y de acuerdo con esto, seleccionar los indicadores. Características de buenos indicadores Los buenos indicadores tienen ciertas
        características importantes. Tal vez la principal es la validez.
        ¿Mide el indicador lo que se supone que debe medir? Por ejemplo, en una encuesta, las
        preguntas sobre el tamaño ideal de familia generalmente no están diseñadas para ser
        medidas válidas de la demanda de fecundida, debido a los sesgos de las respuestas. En
        cambio, la intención indicada de tener más hijos está diseñada para ser un indicador
        válido de demanda de fecundidad, puesto que tiende a ser menos influenciada por el sesgo
        de respuesta. Otro ejemplo son las venta de equipos de embarazo seguro mercadeados
        socialmente.  Este puede ser un indicador válido de su nivel de uso, si los usuarios
        no están sustituyendo el producto mercadeado por otros métodos o prácticas. Otra dimensión de la validez es que el
        indicador debe tener una conexión cercana, o al menos defendible a la intervención. Por
        ejemplo, la tasa de mortalidad materna, en general no es una medida válida del impacto de
        un programa de planificación familiar sobre la salud femenina. Aunque los programas de
        planificación familiar ciertamente contribuyen a reducir la mortalidad materna, existen
        otros factores (atención prenatal, sistema de referencia, acceso a la atención
        hospitalaria, transporte) que también influyen en la tasa. Un indicador con mayor validez
        del impacto de la planificación familiar en la salud de las mujeres puede ser el número
        de nacimientos de  mujeres que pertenecen a categorías de alto riesgo. La confiabilidad es otra característica
        deseable en un buen indicador. La confiabilidad se refiere al grado de error de medición
        aleatorio en un indicador. El error de medición puede surgir de un error de muestreo, un
        error de no muestreo o una medición subjetiva del indicador. Por ejemplo, debido al error
        de muestreo, una encuesta nacional como la DHS no provee estimaciones confiables de la
        práctica anticonceptiva de áreas pequeñas debido a grandes errores de muestreo. Las
        estadísticas de servicios pueden dar medidas más confiables de práctica anticonceptiva
        en estas áreas (aunque pueden no ser válidas si la población en el área obtiene
        anticonceptivos fuera de los servicios oficiales). En resumen, la confiabilidad se refiere a si un
        indicador mide con precisión lo que debe medir. La validez se refiere a si el indicador
        seleccionado es apropiado para medir los cambios en una intervención particular. Un indicador debe definirse con términos claros
        y precisos. De igual forma, es preferible escoger
        indicadores que sean comparables en diferentes grupos poblacionales y enfoques
        programáticos. Los indicadores deben ser insesgados. Los indicadores deben ser recolectados a tiempo. Factores que afectan la selección de
        indicadores En un mundo ideal, el evaluador identificaría
        los indicadores considerados como más útiles para una evaluación determinada y
        procedería a recolectar o conseguir los datos necesarios. Sin embargo, en la realidad,
        cuando enfrenta escasez de tiempo y de recursos humanos y financieros, otros factores
        intervienen en la selección de los indicadores, como los siguientes: 
          Por ejemplo, para valorar los efectos de los programas de
          planificación familiar en la fecundidad y la salud a nivel mundial sería muy útil tener
          datos de todos los países sobre la fuente de financiamiento (agencias donantes, impuestos
          locales, tarifas a los clientes) para la salud reproductiva y sobre los costos de los
          servicios de salud reproductiva. Sin embargo, tales datos no existen por ahora de manera
          fácilmente accesible. 
          Por ejemplo, a los administradores de programa podría gustarles
          saber si su nuevo enfoque de consejería para la lactancia exclusiva trae como resultado
          tasas de continuación más altas. Sin embargo, si la evaluación del programa de
          consejería está limitado por la vida del proyecto (parte del cual se supone que está
          agotado), es imposible determinar los efectos a largo plazo de esta consejería. 
          Por ejemplo, a muchos directores de ICE
          (Información-Comunicación- Educación) les gustaría saber el porcentaje de la
          población meta alcanzado por una determinada campaña y la reacción del público a los
          mensajes. Sin embargo, ellos podrían carecer de los recursos necesarios para realizar una
          encuesta de población. Puede darse un conflicto entre el costo, por un lado, y la
          validez, confiabilidad y oportunidad, por el otro. 
          Por ejemplo, el indicador "años-pareja de protección"
          se ha convertido en una medida ampliamente usada en los programas de planificación
          familiar financiados por la USAID, porque USAID (así como el IPPF) pide a las agencias
          receptoras que informen sobre ese resultado. Para cada indicador es necesario identificar una o más fuentes del
        dato. En la medida que los evaluadores tengan acceso a los informes de otros, es útil
        revisar cómo los colegas investigadores y evaluadores han manejado situaciones
        semejantes. Si esta información falta, la regla cardinal indica: documente cualquier
        decisión relacionada a la operacionalización de los indicadores de una evaluación
        específica. 4.  Fuentes de datos La evaluación de los programas de salud normalmente comprende
        datos a nivel de población y de programa. Al diseñar la evaluación, es esencial hacer
        un inventario de los datos existentes y de la recolección de datos adicionales que son
        necesarios para dar respuesta a las preguntas de evaluación que se van a estudiar. ¿Qué se hace primero? ¿identificar los indicadores a usar o
        identificar  las fuentes de datos disponibles? Los dos procesos están estrechamente
        relacionados. La selección de los indicadores a menudo está determinado por la
        disponibilidad de los datos existentes o la factibilidad de recolectar información
        adicional a un costo mínimo para el programa (por ejemplo, las estadísticas rutinarias
        de servicios). Sin embargo, algunas evaluaciones no pueden realizarse usando los datos
        existentes, tales como la valoración de la calidad de la atención que requieren los
        estudios especiales. En tales casos, uno trata de hacer un esquema de los indicadores de
        interés y luego identifica la recolección de datos requerida para obtener la
        información. La evaluación de programas generalmente consiste en dos
        componentes: resultados en la población (utilizando encuestas de hogares de tipo DHS) y
        productos de programas. Datos a nivel de programas  Los datos de programas provienen de distintas fuentes de
        datos, las cuales pueden ser agrupadas en cuatro categorías. (1) Registros de programas y estadísticas de servicios: los
        registros de programa se refieren a todos los tipos de información generados por una o
        más divisiones del programa y guardados en una oficina central o regional. Algunos
        ejemplos útiles para los programas de seguimiento (especialmente productos funcionales)
        son: el número de visitas de supervisión realizadas a trabajadores CBD (distribución
        comunitaria), el número de personas capacitadas por año por tipo de personal, el número
        de productos de comunicación distintos en un determinado año, la cantidad de productos
        de comunicación distribuidos. Las estadísticas de servicios son una sub-categoría de los datos
        de programa. Incluyen cualquier tipo de información recolectada de rutina y reportada en
        relación a la utilización de un servicio. Los indicadores comunes incluyen las
        características del usuario y el número de visitas a los puntos de provisión de
        servicios (PPS). Generalmente, estos datos son recolectados en cada PPS, luego agregados
        en una oficina central para dar seguimiento y control a tendencias a través del tiempo y
        por sub-unidad dentro del sistema. (2) Encuestas de establecimientos: El objetivo primario de las
        encuestas de establecimientos es describir la disponibilidad, funcionalidad y calidad de
        las actividades de salud materna y perinatal. Esta información puede obtenerse
        entrevistando personas informadas o visitando el establecimiento y observando sus
        operaciones. Los datos de establecimientos también son necesarios para los estudios que
        vinculan información del nivel del programa (por ejemplo, calidad de la atención) con
        resultados a nivel de población. Hay dos tipos básicos de encuestas de establecimientos en
        proyectos de la USAID. El primero, conocido como el "Análisis de situación",
        fue desarrollado en el contexto del proyecto de la Investigación de Operaciones en
        Africa/Asistencia Técnica (OR/TA) (Fisher et al., 1992) y ha sido replicado en varios
        países en el mundo. El segundo es el Módulo de Disponibilidad de Servicios (SAM),
        desarrollado e implementado bajo el programa DHS. Los dos tipos de encuestas se diferencian entre sí por (1) los
        instrumentos de recolección de datos y (2) en la población de PPS que describen. Para el
        Análisis de Situación, los instrumentos para recolección de datos incluyen una serie de
        módulos (por ejemplo, inventario de suministros en el PPS, observación de la
        interacción proveedor-cliente, entrevistas de salida con clientes, entrevistas con
        proveedores de servicios). SAM es una encuesta a comunidades, conducida en conexión con
        la encuesta de hogares en la DHS (en algunos países). Para cada conglomerado muestral de
        la encuesta, informantes clave proveen una lista de los establecimientos cercanos. Los
        equipos de campo obtienen luego la información en cada (1) hospital, (2) clínica, (3)
        centro de salud, (4) farmacia y (5) doctor privado que estén más cercanos dentro de un
        radio de 30 kilómetros del centro del conglomerado. La información recolectada en cada
        sitio cubre la estructura gubernamental (público vs. privado), el número y tipo de
        personal, la infraestructura (equipo, tipo de materiales de construcción), tipos de
        servicios ofrecidos, etc. Esta información es potencialmente útil para valorar la
        disponibilidad y suficiencia de los servicios maternos y perinatales para una población
        determinada y puede ser especialmente importante para vincular los cambios (mejoras) en la
        provisión de servicios maternos y perinatales a los cambios en la prevalencia a través
        del tiempo. La diferencia en el muestreo utilizado en los dos tipos de
        encuestas es la siguiente. El análisis de situación se basa en una muestra al azar de
        los PPS en un país (que puede ser desproporcionadamente localizado en áreas urbanas),
        mientras los datos SAM son recolectados en una muestra al azar de mujeres en el país.
        Entonces, el Análisis de Situación mide el PPS promedio, mientras la SAM mide los
        servicios disponibles a la mujer promedio en un país dado. (3) Sector comercial: Las fuentes de datos en el sector comercial
        generalmente no son parte de las estadísticas de programa, las cuales provienen del
        sector público y de los grandes proveedores no gubernamentales (NGOs).  En cambio,
        no hay una central de estadísticas de servicios maternos y perinatales en el sector
        comercial. Esto se debe, en parte, a la ausencia de un cuerpo central encargado de estos
        datos y en parte porque los proveedores comerciales pueden estar reacios a compartir
        información sobre el volumen y calidad de sus servicios. Algunas de las actividades del
        sector comercial han sido medidas en algunos SAM y Estudios de Análisis de Situación,
        así como en encuestas focalizadas exclusivamente en los proveedores privados. (4) Estudios especiales: Los estudios especiales se realizan para
        responder a una necesidad específica. Pueden emplear métodos de investigación
        cuantitativos o cualitativos. La lista de posibles estudios especiales es larga; algunos
        ejemplos ilustrativos incluyen los siguientes: 
            
           un seguimiento de clientes para determinar su nivel de
        satisfacción con los servicios recibidos 
         grupos focales entre adolescentes que asisten a un programa para
        valorar si éste responde a sus intereses y necesidades 
         una revisión administrativa de los documentos del programa y 
         mapeo de una comunidad para mostrar dónde viven las parejas
        elegibles y qué método   anticonceptivo usan.
                                                                           Datos a nivel de población El instrumento primario para recolectar datos de población es la
        encuesta tipo DHS. La Encuesta Demográfica y de Salud (DHS) generalmente se realiza entre
        una muestra representativa de mujeres en edad reproductiva en un país determinado.
        Recientemente ciertas DHS también han incluido algunos hombres (ya sea una muestra
        independiente de hombres o una muestra de cónyuges de las mujeres entrevistadas en las
        DHS). (Más información sobre esta encuesta, disponible en inglés, dando click en
        DHS)  El cuestionario básico de las DHS consiste en unas 250 preguntas y
        provee información detallada sobre fecundidad, salud materno-infantil, planificación
        familiar, utilización de servicios de salud y temas afines (Robey et al., 1992). Usamos el término "encuestas tipo DHS" para subrayar que
        hay otras encuestas similares a la DHS en contenido y tipo de población estudiada. Los
        Centros para el Control y Prevención de Enfermedades (CDC) han realizado un número de
        Encuestas de Salud Reproductiva en algunos países de América Latina y otras regiones del
        mundo. De igual manera, ciertos países han realizado sus propias encuestas a nivel
        nacional sobre salud materno-infantil, planificación familiar y temas afines. 5.Planes
        de evaluación Una vez que todos los elementos del plan de seguimiento han sido
        acordados, deberían ser mostrados en un formato fácil de leer. La Figura
        3 es un ejemplo de un plan de seguimiento de programas de planificación familiar y la
        Fórmula 2 es una versión en blanco de esta misma fórmula. 
            
                
          
            
              
             |