Skip to main content

Netskope Global Technical Success (GTS)

 

Caso de Uso - Netskope DLP - Uso de clasificadores de archivos con aprendizaje automático (Bloqueo de archivos similares) 

AD_4nXcLCtiWSDmmRS8WyAysFB23uqu_-OQQGyBzv2ti44DK_-tycSo83Gnl3jwoeMIYm2hXUx5KQZ1HqC2X0lgV5uLzzEk07CtWESlr3Op6m-GtcwQ7hp_08K_qgCCdvQVKW6O41qMGqA?key=80JB9QMD2zrfomAYyvK1sw 

 

Netskope Cloud Version - 129

Objectivo

Este documento describe los pasos para crear un clasificador de archivos entrenado con aprendizaje automático que se puede usar en una política de DLP para bloquear la transferencia de archivos similares.

 

Contexto

El uso de clasificadores de archivos entrenados con aprendizaje automático en Netskope es ideal cuando una organización desea identificar y controlar automáticamente el movimiento de contenido confidencial o de riesgo, especialmente cuando la coincidencia de patrones tradicional (por ejemplo, expresiones regulares o reglas de DLP) es insuficiente o demasiado rígida. 

Escenario de ejemplo: 

Una empresa que administra una vasta red de bibliotecas en todo el mundo está preocupada por la posible fuga de datos que involucra documentos confidenciales que detallan los libros que importan a varios países. 

Para evitar que este tipo de información sea expuesta, intencional o involuntariamente, por los empleados, la empresa desea bloquear la transferencia de documentos relacionados con la importación a destinos fuera de la organización. Sin embargo, el desafío radica en identificar con precisión los manifiestos de importación, que pueden no seguir un formato fijo ni contener palabras clave consistentes.

Estos documentos a menudo incluyen detalles clave de envío e inventario críticos para las operaciones de la empresa, y las técnicas tradicionales de DLP pueden no detectarlos de manera confiable. Al aprovechar los clasificadores de archivos basados en aprendizaje automático en Netskope, la empresa puede entrenar un modelo para reconocer automáticamente la estructura y el contexto de los manifiestos de importación. Esto permite una detección y aplicación precisas, lo que garantiza que dichos documentos no puedan cargarse en aplicaciones en la nube no administradas, enviarse a través de correo electrónico personal o compartirse a través de canales no autorizados. 

 

Configuración:

Para lograrlo, se deben seguir los siguientes pasos:

  • Identificar los archivos que le gustaría usar para entrenar el identificador.
  • Crear el clasificador personalizado
  • Cargar los archivos utilizados para entrenar el clasificador
  • Crear un perfil de DLP
  • Crear la política DLP RTP 

 

Identifique los archivos que le gustaría usar para entrenar el identificador.

En este escenario, la empresa tiene como objetivo identificar y clasificar los manifiestos de importación como parte de su estrategia de protección de datos. Para fines de demostración, se han creado varios documentos de muestra para entrenar y probar el clasificador. A continuación se muestra un ejemplo de los datos de muestra:

AD_4nXeqcUX29nRZYSwvGEyWs7Hc7Fhey-Bx6VHOiVr_F-T3RsnhqDb7hb3xCIx-5eeJJjiDfHWFmfuyWvMqzl0uJrsIJymzLeiQ6o9-CeppAmh_VJTInQfZTRoEda2fteZ2_QP16D3x?key=80JB9QMD2zrfomAYyvK1sw

Crear el clasificador personalizado

Para crear un clasificador de archivos, vaya a Policies > Profiles > DLP > File Classifiers > Custom > New File Classifier 

Asigne un nombre al clasificador de archivos y deje el umbral de coincidencia en 60%, ya que es el valor recomendado.

 

Cargar los archivos utilizados para entrenar el clasificador 

Continúe cargando los archivos de entrenamiento. (Haga clic en Upload Training Files) Solo se pueden cargar imágenes en este momento y se deben cargar al menos 20 archivos para entrenar el clasificador. 

Hay dos tipos de archivos de entrenamiento que se utilizan al crear un clasificador de archivos de aprendizaje automático: positivo y negativo. 

  • Los datos de entrenamiento positivo consisten en archivos que representan el tipo de contenido que desea que el clasificador detecte; estos son ejemplos de lo que debe identificarse como una coincidencia.
  • Los datos de entrenamiento negativo incluyen archivos que ayudan al modelo a comprender lo que no debe clasificarse como una coincidencia, lo que reduce los falsos positivos.

En este escenario, solo se cargaron datos de entrenamiento positivos, lo que enfocó el modelo específicamente en reconocer archivos que se asemejan a manifiestos de importación. 

AD_4nXddtSffTtn383Jkv7E0_QcVNEeKfKbPFzpMU-E2tVvUBe_9K08J_dy-w4_CNngdvFYywGQsUr0vVFcGnxODL3N9YzMSzfbTo1Fq173hC0RvVgP4XpZsHGaZJ--SO7P3-hRlLJQfXw?key=80JB9QMD2zrfomAYyvK1sw

Después de cargar los archivos de entrenamiento, haga clic en Save para almacenar tanto los archivos como la configuración del clasificador. 

Luego, espere a que el estado del clasificador cambie a “Active.”

Si el estado no se vuelve Active, es probable que signifique que se proporcionaron datos de entrenamiento insuficientes o que algunos de los archivos cargados no eran válidos.

AD_4nXcg5houBtZA_xfg3xZwLfeFLedo04SMOaRxDHwXEzCyvATDuTfUdNuEpAAJPJTlA5EkXtAIt13dY92Gf6Y5rnHX93CpDXnZD2ArLbmIPcn1S-1zMZCfsY4olEXWURnQu4kR2ITGvw?key=80JB9QMD2zrfomAYyvK1sw

Crear un perfil de DLP

Para crear un Perfil DLP vaya a Policies > Profiles > DLP > New Profile > Next > File Classifier > Select the File Classifier previously created > y establezca un nombre de perfil > Save

AD_4nXf_RQjHMQtS8rTKgHsZcvI7-oM0CnBKeFwuuVmjzD4is6khOVvDUr-r5DlFV78lxriyQCFMInubckuVPiVFhkNtOXzrEBnLm8A6VxuggLqJ3ZUWPjOAb_dc3PvCHFePjXcSkOSg8g?key=80JB9QMD2zrfomAYyvK1sw

Crear la política DLP RTP

Se crearía una política para bloquear las cargas y descargas de manifiestos de importación desde Google Gmail.

Para crear una política de protección en tiempo real (RTP), siga estos pasos:

  1. Navegue a Policies > Real-Time Protection, luego haga clic en New Policy y seleccione Cloud App Access.
  2. Elija el usuario o grupo de usuarios al que se aplicará la política.
  3. Establezca la aplicación en Google Gmail.
  4. En Activities, seleccione Upload y Download.
  5. Haga clic en Add Profile para adjuntar el perfil DLP creado anteriormente, y establezca la acción de actividad asociada en Block.
  6. Proporcione un nombre para la política y asígnela al grupo de políticas apropiado.
  7. Haga clic en Save para aplicar los cambios. 


 

AD_4nXcQ7IFOGLJvRMwoCqOgynRNM7jRi6djRmf7PfVN9m60SiLa4PDTSDJSEqFFtHbpfs3wOh3ltCcw0Luqj8jyhSHKClPFPxJ-Qi2uAb8GNU4fuFOaNAW0thjIFzvLG4Sr8JVSA9Q3xA?key=80JB9QMD2zrfomAYyvK1sw

Demostración: 

Archivo utilizado para la prueba: 

AD_4nXfEwxwZN22FEpVlOGRgSi1ZCh2WVTWhTLYwF0ojETjCD9mF15dnawji06CEkurbmHbmJq8-09onCgAp4n7hiZt7Hpq1NqPH0TtCRwBR8udCSBzrnZ2sjGpbSURzXLbbWlO7Ck_kWA?key=80JB9QMD2zrfomAYyvK1sw

Muestra de archivo utilizada para el entrenamiento: 

AD_4nXfL-5snFha9t7WfRR8EaYV8OGrqNUFSE3FShhNSynMqOtPXlWig0Td8MR2_pjLtN9pDWXS5aNgibB_sM-VFlU-Sufpgar_COkndRt3A78KwOhHm7lmtDDGC0NPmwdDvwGOTGCWb?key=80JB9QMD2zrfomAYyvK1sw

 

Experiencia de usuario: 

AD_4nXeEoPPVurzHbKaNSaHQ8JWrFkPYlyw7NrGf90OS3lZZpiMMtB5C7ddiJRNcNPa43lsyKMtvdduHLG2hWD4yk_3FH-GhpWOP7_HiMscznBjYobuKorzDhSkG0XlaC54E4UyY_kz84g?key=80JB9QMD2zrfomAYyvK1sw

 

Incidentes de DLP de Netskope: 

AD_4nXel62KQA4KlHaNlW327G4Li7_GC7KJomGFn7nQx7fXdmTa9MQQtfdxDXhwBknywc9G8mI8SxlMD2Gxiz7B-z0SZNZzJOuwGU5yWhwwXpJot3qSnq4O3cMHl95D5co51koQMfV0TqA?key=80JB9QMD2zrfomAYyvK1sw

Evento de aplicación de Netskope: 

AD_4nXcLxDp2v7dZWp-j1_yMa9dxW9mnydKV7UQSKG7q1jB9B-JwWrLz64vgERak3k8PW4wwqyCxlwlZvDOrF1pZUDATPDKrosqXaTNKy3txQMBxhhjUwJmPePn64tkNuO7Ulmw44KYohA?key=80JB9QMD2zrfomAYyvK1sw
 

Conclusión 

Los clasificadores de archivos entrenados con ML son realmente útiles cuando:

  • El contenido es complejo, no estructurado o carece de identificadores claros
  • Necesita mayor precisión y detección con conocimiento del contexto
  • Quiere ir más allá de lo que las DLP tradicionales pueden detectar
  • Reducir los falsos positivos es una prioridad
  • Se requiere visibilidad o control sobre la propiedad intelectual o los documentos internos 


 

Términos y condiciones 

  • Toda la información documentada se somete a pruebas y verificación para garantizar la precisión. 
  • En el futuro, es posible que el proveedor altere la funcionalidad de la aplicación. Si se nos informa de dichos cambios, actualizaremos rápidamente la documentación para reflejarlos. 

 

Notes

  • Esta función requiere licenciamiento DLP Advanced.
  • Todos los datos de muestra utilizados para las pruebas no son reales y se crearon al azar para fines de documentación.
  • Este artículo fue escrito por Netskope Global Technical Success (GTS).
  • Para cualquier consulta adicional relacionada con este artículo, comuníquese con Netskope GTS enviando un caso de soporte con 'Case Type – How To Questions'. 

 

Be the first to reply!