in FIGEMPA: Investigación y Desarrollo
Predicción de Producción de Fluidos empleando Machine Learning en T Inferior del Campo Sacha
Resumen
El presente estudio tiene por objeto predecir la producción de fluidos de los pozos perforados durante el año 2021 en la arenisca T inferior en el campo Sacha. Se tomó en cuenta la información petrofísica y de fluidos para la construcción del modelo a partir de un pozo tipo mediante el software comercial el cual proporciona el análisis del comportamiento de pozos. Paralelamente mediante el lenguaje de programación Python a través de Machine Learning se desarrolló dos algoritmos: uno basado en los datos de presión de entrada (PIP) de la bomba electrosumergible (BES), y otro con datos PIP y salinidad del agua de formación del reservorio. La predicción de producción de fluidos respecto a la producción real obtuvo un error de 2% con el software comercial mientras que en las dos simulaciones a través de Python se obtuvo 10% y 0.5% de error respectivamente. Para el caso de la predicción de producción de gas el valor real es de 0.07 MMSCFD mientras que el obtenido mediante la simulación con el software comercial es de 0.41 MMSCFD. Para el caso de la primera y segunda simulación con Python se obtuvo una mejor aproximación de 0.11 MMSCFD y 0.10 MMSCFD respectivamente. El incremento de variables en Python permite la reducción del porcentaje de error e incrementa el ajuste de la predicción de producción de fluidos y gas, en este caso la PIP de la BES y salinidad de agua de formación.
Main Text
INTRODUCCIÓN
El objetivo final del modelamiento de un campo petrolero es idear una estrategia óptima para desarrollar, administrar y operar el campo. Para algunos campos petroleros, la optimización de las operaciones de producción puede ser un factor importante para aumentar las tasas de producción y reducir los costos. Mientras que para pozos individuales u otros sistemas pequeños el análisis nodal simple puede ser adecuado, los sistemas grandes y complejos exigen un enfoque mucho más sofisticado para predecir con precisión la respuesta de un sistema de producción y para examinar escenarios operativos alternativos de manera eficiente.
A medida que los algoritmos de optimización y las técnicas de simulación de yacimientos continúan desarrollándose y la capacidad computacional continúa aumentando, las instalaciones de petróleo y gas que antes se pensaba que no eran candidatas para el control u optimización avanzados están siendo objeto de nuevas consideraciones.
El presente estudio compara las predicciones de producción de un pozo tipo de la arenisca T inferior del campo Sacha con las obtenidas mediante software comercial con el fin de mejorar el método de cálculo y tener mayor exactitud del volumen de fluidos a producir para que las facilidades de producción y de levantamiento de los fluidos sean las idóneas. Además, se presenta propuestas en base a los resultados obtenidos, los cuales servirán como fundamentos teóricos y técnicos para futuros proyectos de explotación de pozos.
MATERIALES Y MÉTODOS
El presenteestudio se ha aplicado en un enfoque analítico - descriptivo, en el cual seanalizó la predicción de la producción de agua, gas y petróleo, a través de lautilización de software comercial en la arena T inferior del campo Sachabasados en los datos de presión de entrada de la bomba electrosumergible y laproducción de los pozos del año 2021. En la Tabla 1 se presentan los datos de produccióndel pozo tipo.
Consideraciones teóricas
Los métodos de optimización de machine learning en la industria petrolera se introdujeron por primera vez en la industria de exploración y producción (E&P) de petróleo en la década de 1940, y desde entonces se han utilizado ampliamente para predecir, estimar y determinar varios parámetros operativos. Estos métodos se clasifican principalmente en tres grupos que incluyen técnicas de programación lineal, entera y no lineal.
Los algoritmos de inteligencia artificial (IA) se han utilizado ampliamente para resolver problemas en la industria del petróleo y el gas. Zhou (2019) menciona que la IA se define como la capacidad de los agentes inteligentes para el aprendizaje continuo en el entorno correspondiente y la percepción de determinadas actividades. AI se compone principalmente de Algoritmos Evolutivos (EA), Inteligencia de Enjambre (SI), Lógica Difusa (FL) y Redes Neuronales Artificiales (RNA).
Red neural artificial (RNA)
Consiste en un conjunto de unidades de procesamiento simples, que comunicarse mediante el envío de señales entre sí a través de un gran número de conexiones ponderadas. La neurona recibe la información de sus vecinos o fuentes externas y usar esta entrada para calcular una señal de salida que luego se propaga a otras unidades. Además de este procesamiento, la segunda tarea es el ajuste de los pesos. El sistema es inherentemente paralelo en el sentido de que muchas unidades pueden realizar sus cálculos al mismo tiempo. En la mayoría de los casos, se supone que cada unidad proporciona una contribución aditiva a la entrada de la unidad con la que está conectado (Rahmanifard & Plaksina, 2018).
Como se muestra en la Figura 1, la entrada total (sk(t)) a la unidad k es una simple suma ponderada de las salidas de cada una de las unidades conectadas más un término de polarización o compensación (θk) por lo que se requiere una regla que calcule el efecto de la entrada total sobre la salida de la unidad.
Por lo tanto, una función (Fk) que toma la entrada total sk(t) y produce un nuevo valor de la se necesita la activación de la unidad k (función de activación o transferencia). Las funciones de transferencia sirven principalmente como un tipo de filtro o puerta que permite que algunas señales se muevan avanzar y detener a otros a medida que avanzan desde los nodos de entrada a los de salida. lo más las funciones de activación comúnmente utilizadas son sigmoide logarítmica, sigmoide tangente hiperbólica, y funciones lineales.
Hay varios patrones de RNA,como redes feed-forward, redes recurrentes, etc. Las redes feed-forwardconvencionales son las redes más comunes para la aproximación de funcionesmismas que constan de grupos de nodos interconectados dispuestos en capascorrespondientes a entrada, oculta y nodos de salida, se muestra en la Figura2.
LenguajePython
El lenguaje de programación Python es un lenguaje fácil de aprender. Éste cuenta con estructuras de alto nivel que puede dar un enfoque simple pero asertivo hacia la programación dirigida a objetos. Las características que se revelan en su sintaxis y su tipado dinámico lo transforman en un lenguaje ideal para scripting y para el uso de aplicaciones en diferentes áreas (inteligencia artificial, big data, data science, desarrollo web, entre otros) (Ibrahim & Bilchick, 2021). En la Figura 3 se presenta el algoritmo utilizado en el lenguaje de programación Python para las simulaciones.
Análisis y depuración de datos
Para lasimulación fue utilizada la normalización de datos para el posterior uso declustering con el objetivo de eliminar los valores atípicos. Se realizó uncálculo iterativo de radio vs producción con el fin de obtener el mejor ajuste.Para el caso de estudio se determinó si los datos tienen un rango mayor al radiode 0.2 para fluidos y 0.8 para gas es un valor atípico. La Figura 4 muestra laventana de análisis y depuración de datos donde se grafican la PIP vsproducción de fluido (izquierdo) y la PIP vs producción de gas (derecho).
Modeloentrenado
Luego de ladepuración de datos se realizó el entrenamiento de la RNA, en la que se obtuvográficas comparativas de la producción real y estimada con la red neuronal delos pozos como se observa en la Figura 5. La primera estimación se utilizó comovariable la PIP, mientras que en la segunda estimación a más de la PIP seutilizó la salinidad del agua de formación. En la sobreposición de las curvas se observa el mejor ajuste delalgoritmo que permitirá la predicción de la producción.
RESULTADOS Y DISCUSIÓN
Para determinarla producción con el software comercial se utilizó la información disponibledel pozo tipo. De forma paralela se realizaron dos predicciones de producciónde fluido y gas: la primera con el valor de la PIP del pozo tipo de 250 Psi, yla segunda con el mismo valor de la PIP de la primera simulación y el valor dela salinidad del agua de formación de 50000 ppm. A partir de estos resultados se realizó lacomparación de producción real versus la simulada tanto en el softwarecomercial como en Python del pozo tipo como se indica en la Tabla 2.
Análisiscomparativo de las simulaciones
En la primera simulación se obtuvo un error del 10% con respecto al valor real de producción de fluidos del pozo tipo ya que únicamente se utilizó una variable. En la segunda simulación, el error se redujo a 0,5% debido a que se incrementó una variable adicional para obtener un mejor ajuste. Previamente se había realizado simulaciones con variables como la temperatura del pozo y el grado API donde no se determinó un cambio significativo de resultados por ser valores promedios para todos los pozos del Campo. Por el contrario, la PIP de la BES se relaciona directamente con la producción y la salinidad con la porosidad, permeabilidad, saturación de agua, arena productora y presión capilar, que son propiedades directamente relacionadas en el potencial de producción. En la Figura 6 se muestran los gráficos de barras de las simulaciones.
CONCLUSIONES
- El uso de nuevas tecnologías como el machine learningpermite que las predicciones de producción sean más precisas y se reduzca laincertidumbre.
- La concatenación y normalización de datos permiteneliminar los valores atípicos por lo cual es importante tener criteriosadecuados para excluir estos valores como conocer el mejor método para estecaso fue el clustering y dentro de este la variable radio con el mejor ajustede 0.8 para gas y 0.2 para fluidos.
- La reutilización de código en las funciones optimizaespacio, y contribuye con la eficiencia del programa, esto puesto que tantopara gas como para fluidos se utiliza el mismo código además de que lasfunciones que requieran cálculos similares se utiliza la misma función en laque ya se realizó ese cálculo previo.
- Las variables que actúan directamente en el potencialde producción del pozo tipo reducen el porcentaje de error en la predicción deproducción con respecto al software comercial.
- El mejoramiento de la predicción de producción se debe al uso de las redes neuronales artificiales que son las responsables de crear algoritmos de inteligencia artificial, estos permiten emular el comportamiento no lineal presentado por la PIP y la salinidad con respecto a la producción de fluido.
Resumen
Main Text
INTRODUCCIÓN
MATERIALES Y MÉTODOS
Consideraciones teóricas
Red neural artificial (RNA)
LenguajePython
Análisis y depuración de datos
Modeloentrenado
RESULTADOS Y DISCUSIÓN
Análisiscomparativo de las simulaciones
CONCLUSIONES