Modellierung der Penetrationsrate bei Bohrvorgängen mithilfe der Modelle RBF, MLP, LSSVM und DT

Blog

HeimHeim / Blog / Modellierung der Penetrationsrate bei Bohrvorgängen mithilfe der Modelle RBF, MLP, LSSVM und DT

Nov 12, 2023

Modellierung der Penetrationsrate bei Bohrvorgängen mithilfe der Modelle RBF, MLP, LSSVM und DT

Wissenschaftliche Berichte Band 12,

Wissenschaftliche Berichte Band 12, Artikelnummer: 11650 (2022) Diesen Artikel zitieren

1356 Zugriffe

4 Zitate

Details zu den Metriken

Eines der größten Probleme, mit denen die Bohrindustrie konfrontiert ist, sind die Bohrkosten. Viele Faktoren beeinflussen die Bohrkosten. Eine längere Bohrzeit trägt wesentlich zur Erhöhung der Bohrkosten bei. Eine der Lösungen zur Reduzierung der Bohrzeit ist die Optimierung der Bohrgeschwindigkeit. Das Bohren von Brunnen zum optimalen Zeitpunkt verkürzt die Bohrzeit und senkt somit die Bohrkosten. Die Bohrgeschwindigkeit hängt von verschiedenen Faktoren ab, von denen einige kontrollierbar und andere unkontrollierbar sind. In dieser Studie wurden mehrere intelligente Modelle und eine Korrelation vorgeschlagen, um die Penetrationsrate (ROP) vorherzusagen, die für die Planung eines Bohrvorgangs sehr wichtig ist. Es wurden 5040 reale Datenpunkte von einem Feld im Süden Irans verwendet. Der ROP wurde mithilfe von Radial Basis Function, Decision Tree (DT), Least Square Vector Machine (LSSVM) und Multilayer Perceptron (MLP) modelliert. Der Bayesianische Regularisierungsalgorithmus (BRA), der skalierte konjugierte Gradientenalgorithmus und der Levenberg-Marquardt-Algorithmus wurden zum Trainieren von MLP verwendet, und Gradient Boosting (GB) wurde für DT verwendet. Um die Genauigkeit der entwickelten Modelle zu bewerten, wurden sowohl grafische als auch statistische Techniken verwendet. Die Ergebnisse zeigten, dass das DT-GB-Modell mit einem R2 von 0,977 die beste Leistung aufweist, gefolgt von LSSVM und MLP-BRA mit einem R2 von 0,971 bzw. 0,969. Abgesehen davon weist der vorgeschlagene empirische Zusammenhang trotz seiner Einfachheit eine akzeptable Genauigkeit auf. Darüber hinaus zeigte die Sensitivitätsanalyse, dass Tiefe und Pumpendruck die größten Auswirkungen auf ROP haben. Darüber hinaus bestätigte der Leverage-Ansatz, dass das entwickelte DT-GB-Modell statistisch gültig ist und etwa 1 % der Daten vermutet werden oder außerhalb des Anwendbarkeitsbereichs des Modells liegen.

Eines der wichtigsten Probleme der Ölindustrie, insbesondere der Bohrindustrie, sind die Bohrkosten und haben in den letzten Jahrzehnten große Aufmerksamkeit erregt. Viele Faktoren können die Bohrkosten beeinflussen, der wichtigste davon ist die Bohrzeit des Bohrlochs, die die Bohrkosten um ein Vielfaches erhöhen kann. Daher ist die Verkürzung der Bohrzeit eines der wichtigsten Ziele der Bohringenieure1,2,3. Mit anderen Worten: Eines der Hauptziele der Bohroptimierung ist die Verkürzung der Gesamtzeit4. Zu diesem Zweck wurden zwei Möglichkeiten vorgeschlagen: Auswahl optimaler Bohrvariablen (z. B. Auswahl eines geeigneten Bohrflüssigkeitstyps und Bohrers) und sofortige Analyse, um Betriebsparameter wie Drehzahl und Gewicht des Bohrers während des Bohrens zu optimieren4.

Der Hauptfaktor, der die Bohrzeit beeinflusst, ist die Eindringgeschwindigkeit (ROP)5. Daher ist die Präzision des ROP-Modells von entscheidender Bedeutung6. Viele Parameter wirken sich auf die Bohrgeschwindigkeit aus, darunter Bohrschlammeigenschaften, Formationseigenschaften, Drehzahl und Bohrereigenschaften2,7. Die wichtigsten Parameter, die ROP beeinflussen, sind in Abb. 1 dargestellt. Einige dieser Parameter sind nicht kontrollierbar, wie etwa die Formationseigenschaften, andere sind kontrollierbar, wie etwa die Eigenschaften des Bohrschlamms. Durch die individuelle Untersuchung der Auswirkung verschiedener Parameter auf den ROP kann leicht untersucht werden, beispielsweise die Gesteinsfestigkeit, die Umdrehungen pro Minute (RPM) und das Gewicht auf der Bohrkrone (WOB)8. Eine zunehmende einachsige Druckfestigkeit des Formationsgesteins führt zu einer Verhärtung und verringert somit die Penetrationsrate8,9. Auch die Bohrparameter sind steuerbare Faktoren zur Änderung der Bohrgeschwindigkeit. Der Bohrertyp und seine Gattung10 sowie die Passform des Bohrers und die Formation tragen wirksam zur Steigerung der Bohrgeschwindigkeit bei. Obwohl eine Erhöhung der Drehzahl11 die Bohrgeschwindigkeit in weichen Formationen erhöht, ist dies in harten Formationen nicht direkt sichtbar und niedrige Drehzahlen können zu besseren Bohrgeschwindigkeiten führen. Die Fließgeschwindigkeit und die Eigenschaften des Bohrschlamms, wie z. B. plastische Viskosität (PV), Schlammgewicht (MW) und Fließgrenze (YP), bestimmen die Fähigkeit des Schlamms, Bohrklein an die Oberfläche zu übertragen. Ein besserer Schnitttransport an die Oberfläche verhindert die Ansammlung von Schnittgut und Nachschleifen und erhöht die Bohrleistung. Der WOB bestimmt den Grad des Kontakts und des Eindringens des Bohrmeißels in die Formation, der von der Art des Gesteins abhängt und die Bohrgeschwindigkeit erhöhen kann, aber der WOB hat bis zu einem gewissen Grad eine direkte Beziehung zur Bohrgeschwindigkeit und hat dann keine große Bedeutung Auswirkungen auf die Bohrgeschwindigkeit12,13. Zur Vorhersage des ROP wurden viele Modelle vorgeschlagen, die jedoch problematisch sind, da sie entweder im Labor oder auf der Grundlage unvollständiger Felddaten ermittelt werden2,14. Mit anderen Worten: Die Auswirkungen der Bohrvariablen auf den ROP sind noch nicht vollständig verstanden15. Bisher wurden verschiedene Methoden zur Optimierung der Bohrgeschwindigkeit vorgeschlagen, aber aufgrund der Tatsache, dass eine große Anzahl von Parametern die Bohrgeschwindigkeit beeinflussen, ist die Entwicklung eines effizienten und umfassenden Modells sehr schwierig. Andererseits hat die komplexe Beziehung zwischen diesen Parametern dazu geführt, dass kein umfassendes Modell vorhanden ist2,14.

Die Hauptfaktoren, die ROP beeinflussen.

Normalerweise werden zwei Hauptansätze zur Vorhersage des ROP verwendet, darunter traditionelle Modelle und Modelle des maschinellen Lernens (ML).

Einige berühmte traditionelle Korrelationen sind wie folgt:

Maurer16 entwickelte Gl. (1) für Rollfräser:

In der obigen Gleichung sind S und K die Druckfestigkeit des Gesteins bzw. die Proportionalitätskonstante. Wo und W sind das Schwellenbitgewicht bzw. das Bitgewicht. db gibt den Durchmesser des Bohrers an und N bezeichnet die Drehzahl.

Ein weiteres traditionelles Modell für ROP wurde von Bingham17 eingeführt:

Dabei beziehen sich R, W, \(d_{bit}\) und N jeweils auf ROP (ft/hr), Gewicht auf Bit (klbs), Bitdurchmesser (in) und Drehzahl (rot/min). K und \(a_{5}\). sind Bingham-Koeffizienten und haben für verschiedene Formationen unterschiedliche Werte18.

Eines der wichtigsten ROP-Modelle wurde von Bourgoyne und Young19 entwickelt. Dieses Modell wird in der Industrie häufig eingesetzt20. Gleichung (3) wurde von Bourgoyne und Young19 vorgeschlagen. Am Modell von Bourgoyne und Young19 (BYM) waren acht Parameter beteiligt.

wobei D die Bohrlochtiefe angibt, sind die Koeffizienten a1 bis a8 mit dem Formationsfestigkeitsparameter, der Formationsverdichtung, dem Porendruck, dem Differenzdruck, dem Exponenten der Gewichtung auf den Bohrer, dem Rotationsbohren, dem Zahnverschleiß des Bohrers und dem hydraulischen Strahlaufprall des Bohrers verknüpft. und t bezeichnet die Zeit. Anschließend schlugen Bourgoyne et al.18 eine Anpassung an ihr ursprüngliches ROP-Modell vor:

In der obigen Gleichung beinhalten die Funktionen f1 bis f8 die empirischen Koeffizienten a1–a8. Wie von Soares und Gray6 festgestellt, ist der Hauptunterschied zwischen den Gl. (3) und (4) steht in der letzten Funktion. Gleichung (3) verwendet Eckels hydraulische Reynolds-Zahl, jedoch in Gl. (4) Es wurde eine Potenzgesetzfunktion der hydraulischen Strahlaufprallkraft verwendet. Obwohl die BYM-Gleichungen alle wichtigen Merkmale des Bohrens beschreiben, werden einige Parameter, die im Modell notwendig sind, nicht einfach in Echtzeit gemessen (z. B. Bohrerverschleiß, Differenzdruck)6.

Ein allgemeines Drag-Bit-Modell wurde von Hareland und Rampersad21 eingeführt:

Dabei geben Nc und Av die Anzahl der Fräser und die vor einem Fräser komprimierte Gesteinsfläche an, was je nach Bohrertyp eine unterschiedliche Formulierung voraussetzt. Weitere Einzelheiten finden sich bei Soares et al. Arbeit22.

Die eindeutige Verbindung zwischen den Bohrparametern zu finden, ist nicht ausreichend bekannt und sehr schwierig15. Daher wurden einige Untersuchungen23,24,25 durchgeführt, um den Zusammenhang zwischen den Bohrparametern und deren Auswirkungen auf den ROP besser zu verstehen. Beispielsweise schlugen Motahhari et al.23 ein ROP-Modell für polykristalline Diamant-Kompaktbohrkronen (PDC) vor:

In dieser Gleichung zeigt S die begrenzte Felsfestigkeit an. \(\alpha\) und y stellen den Koeffizienten des ROP-Modells dar und Wf bezeichnet den Verschleiß. G stellt den Koeffizienten dar, der sich auf die Gesteinsgeometrie und die Wechselwirkungen zwischen Gestein und Gestein bezieht. Deng et al.24 schlugen ein theoretisches Modell für ROP vor. Dieses Modell wurde für Rollenkegelmeißel entwickelt und mit Ergebnissen aus experimentellen Daten validiert. In diesem Modell wurde die dynamische Druckfestigkeit des Gesteins in umgekehrter statischer Druckfestigkeit verwendet, was die Genauigkeit des theoretischen Modells verbesserte. Gl. (7) wurde von Al-AbdulJabbar et al.25 entwickelt und basiert auf einer Regressionsanalyse:

wobei 16,96 für umgerechnete Einheiten verwendet wird, \({\uprho }\) die Schlammdichte angibt, T das Drehmoment bezeichnet, SSP den Standrohrdruck darstellt, Q die Durchflussrate darstellt, PV die plastische Viskosität darstellt und UCS die einachsige Druckfestigkeit bezeichnet . Zur Berechnung der Koeffizienten (a und b) wurde eine nichtlineare Regression verwendet.

Von Warren vorgeschlagene Gleichung (8):

wobei S die Felsfestigkeit angibt und \({\text{a}}\) und \({\text{c}}\) die Konstante8 bezeichnen.

Viele Forscher berücksichtigten die Auswirkungen anderer Faktoren, wie z. B. die Spanhaltung26,27, den Meißelverschleiß28 und die Schnittgeometrie29,30. Eckel31 brachte zum Ausdruck, dass Schlammeigenschaften keinen direkten Einfluss auf ROP haben, während Paiaman et al.32 zeigten, dass eine Erhöhung der plastischen Viskosität und des Schlammgewichts die Penetrationsrate verringern kann. Moraveji et al.33 entwickelten ein Modell und zeigten, dass die Gelstärke, das WOB und das YP/PV-Verhältnis einen bemerkenswerten Einfluss auf den ROP haben.

Soares et al.22 zeigten Einschränkungen traditioneller ROP-Mods auf, wie z. B. das von Bourgoyne et al.19 eingeführte Modell. ML-Methoden sind interessante Methoden zur ROP-Vorhersage. Die Priorität maschineller Lerntechniken gegenüber herkömmlichen Modellen wurde von mehreren Forschern nachgewiesen8,34,35,36. Die erste Arbeit zur Vorhersage von ROP durch ML wurde von Bilgesu et al.37 durchgeführt. Die Fähigkeit der neuronalen Netze, eine komplexe Beziehung zwischen Daten zu finden, hat dazu geführt, dass dieser Ansatz zur Vorhersage der Bohrraten gewählt wurde. Heutzutage werden künstliche neuronale Netze (ANNs) häufig in der Ölindustrie eingesetzt. Einige davon erwähnen wir im folgenden Teil kurz. Alarfaj et al.38 sagten ROP mithilfe von ANNs voraus und verglichen mehrere Modelle. Sie kamen zu dem Schluss, dass die Extreme Learning Machine (ELM) genaue Ergebnisse liefert. Sie berücksichtigten in ihren Modellen nicht den Einfluss von Durchflussrate, Drehzahl, MW und Bohrerdurchmesser. Ansari et al.39 nutzten die Fehleranalyse der multivariaten Regression, um die besten Parameter zur Vorhersage des ROP auszuwählen, und verwendeten dann Techniken der Support Vector Regression (SVR) zur Modellierung des ROP. Schließlich wurde die Committee Support Vector Regression (CSVR) basierend auf dem Imperialist Competitive Algorithm (ICA) zur Vorhersage des ROP eingesetzt. Ihre Ergebnisse zeigten, dass das CSVR-ICA-Modell das Ergebnis von SVR39 verbessern kann. Hegde et al.36 führten eine Evaluierung zweier unterschiedlicher Ansätze, physikbasierter und datengesteuerter Modellierungsansätze, zur Vorhersage des ROP durch. Ihre Ergebnisse zeigten, dass das datengesteuerte Modell eine bessere Vorhersage lieferte als herkömmliche Modelle36. Soares und Gray6 untersuchten die Echtzeit-Vorhersagefähigkeiten von ML- und analytischen ROP-Modellen. Ihre Ergebnisse zeigten, dass ML-Modelle den Fehler viel besser verringern als analytische Modelle. Darüber hinaus erzielte BYM6 unter den Analysemodellen die beste Leistung. Ashrafi et al.40 nutzten hybride Modelle der künstlichen Intelligenz, um den ROP vorherzusagen. Basierend auf ihren Ergebnissen erzielte die Partikelschwarmoptimierung-Mehrschichtwahrnehmung (PSO-MLP) die beste Leistung40. Die Verwendung von ANN zur ROP-Vorhersage während des Bohrvorgangs wurde auch von Diaz et al.41 bewertet. Gan et al.42 schlugen ein neues Hybridmodellmodell zur Schätzung des ROP vor. In dieser Studie wurde eine hervorragende Vorhersageleistung ihres vorgeschlagenen Modells gezeigt42. Mehrad et al.43 verwendeten Schlammprotokollierung und geomechanische Parameter, um ROP durch einen Hybridalgorithmus vorherzusagen. Der Least-Square-Support-Vector-Machine-Cuckoo-Optimierungsalgorithmus (LSSVM-COA) hatte die beste Leistung unter den verwendeten Modellen. Der Fehlerunterschied in den Trainings- und Testdaten des von LSSVM-COA entwickelten Modells war gering43.

Diese Studie wird durchgeführt, um eine empirische Korrelation und einige intelligente Modelle zu entwickeln, darunter die kleinste Quadratvektormaschine (LSSVM), das mehrschichtige Perzeptron (MLP), der Entscheidungsbaum (DT) und die radiale Basisfunktion (RBF) für ROP auf der Grundlage einer großen Datenbank (mehr als 5000 Datenpunkte), gewonnen aus Bohrungen in den südlichen Feldern des Iran. Gradient Boosting (GB) wird für die DT-Optimierung verwendet und der Bayesianische Regularisierungsalgorithmus (BRA), der Scaled Conjugate Gradient Algorithm (SCGA) und der Levenberg-Marquardet-Algorithmus (LMA) werden zum Trainieren der MLP-Modi verwendet. Das Besondere an dieser Studie ist die Berücksichtigung effektiverer Parameter bei der Entwicklung der Modelle. Zu diesen Parametern gehören Tiefe (D), Gewicht auf Bohrmeißel (WOB), Gesamtgrube (PT), Pumpendruck (PP), Hakenlast (H), Oberflächendrehmoment (ST), Drehzahl (RS), Durchfluss (Fi), Ausfluss (Fo) und Bohrlochkopfdruck (Wp). Die Genauigkeit und Gültigkeit der vorgeschlagenen Modelle werden durch statistische und grafische Techniken bewertet. Darüber hinaus wird der Leverage-Ansatz verwendet, um die Gültigkeit der experimentellen Daten und den Anwendbarkeitsbereich der vorgeschlagenen Modelle zu überprüfen.

Um eine empirische Korrelation für ROP zu entwickeln, haben wir eine Struktur für die Korrelation vorgeschlagen und den Generalized Reduced Gradient (GRG) verwendet, um den Korrelationskoeffizienten zu optimieren. Die optimale Struktur wurde durch ein Versuch-und-Irrtum-Verfahren ermittelt. GRG ist als eine der Techniken zur Lösung multivariabler Probleme bekannt. Mit dieser Methode werden sowohl nichtlineare als auch lineare Probleme gelöst44. Bei dieser Methode werden Variablen so reguliert, dass die aktiven Einschränkungen weiterhin erfüllt werden, sobald der Prozess von einem Punkt zum anderen wechselt. Die lineare Schätzung des Gradienten an einem bestimmten Punkt y wird von GRG entwickelt. Sowohl der objektive Gradient als auch die Einschränkung werden parallel gelöst. Die objektive Gradientenfunktion kann in Form der Restriktionsgradienten bezeichnet werden. Später kann die Suche realistischer verlaufen und die Größe des Suchbereichs wird reduziert. Für eine Zielfunktion f(y), die h(y)45 unterliegt:

GRG kann wie folgt angegeben werden45:

Eine der entscheidenden Bedingungen für die Minimierung von f(y) ist, dass df(y) = 0. Interessierte Leser können weitere Einzelheiten in der Literatur erfahren46,47,48,49.

DT ist als nichtparametrische Methode des überwachten Lernens bekannt, die sowohl für Klassifizierungs- als auch für Regressionsprobleme angewendet werden kann. Morgan und Sonquist50 führten die automatische Interaktionserkennung (AID) ein, den sogenannten ersten Entscheidungsbaum. Messenger und Mandell51 führten THeta Automatic Interaction Detection (THAID) ein, den ersten Klassifizierungsbaumalgorithmus. THAID ist ein hierarchisches Flussdiagramm mit Zweigen, Wurzelknoten, internen Knoten und Blattknoten. Ein oberster Knoten, der keinen Einkommenszweig hat, wird Wurzelknoten genannt. Der Wurzelknoten stellt den gesamten Beispielraum dar. Knoten enthalten einen eingehenden Zweig und mehrere ausgehende Kanten sind die internen oder Testknoten. Blätter oder Endknoten sind Knoten, die die Endergebnisse anzeigen. Beschneiden, Stoppen und Aufteilen sind drei Hauptverfahren zur Erstellung eines Entscheidungsbaums52. Im Aufteilungsschritt erfolgt die Aufteilung der Daten in eine Reihe von Teilmengen, basierend auf dem Testen des am häufigsten genannten Attributs, das auch für die Trainingsinstanzen gültig ist. Für die Reduzierung der Standardabweichung, der Varianz und des Klassifizierungsbaums könnten verschiedene Kriterien wie Gini-Index, Informationsgewinn, Gewinnverhältnis, Informationsgewinn, Klassifizierungsfehler und Schleppen berücksichtigt werden53. Abbildung 2 zeigt eine Instanz eines Entscheidungsbaums, der sowohl für die Regression als auch für die Klassifizierung verwendet wird. Die Datenaufteilung beginnt am Wurzelknoten und entwickelt sich zum internen Knoten, bis die Stoppkriterien erreicht oder die vordefinierte Homogenität erfüllt ist. Die Darstellung der Abbruchkriterien kann zu einer Verringerung der Problemkomplexität führen. Dieser Ansatz führt dazu, dass eine Überanpassung vermieden wird. Eine Aufteilung würde zu einem komplexen Baum führen, wenn die Stoppkriterien nicht angewendet werden. Obwohl die Trainingsdaten gut angepasst wären, tritt dies bei den Testdaten nicht auf. Die Verwendung der dargestellten Stoppkriterien wäre auf die Optimierung des Modells für den besten Wert beschränkt. Um eine Überanpassung zu vermeiden, wird die Beschneidungstechnik angewendet, wenn die Stoppmethoden nicht richtig funktionieren. Bei der Schnitttechnik entsteht ein vollständiger Baum. Anschließend wird es auf kleine Bäume beschnitten, die durch das Entfernen einiger Knoten generiert werden, die weniger Informationsgewinn- oder Validierungsdaten enthalten.

Das schematische Diagramm von DT.

RBF und MLP sind die am häufigsten verwendeten Modelle für künstliche neuronale Netze (ANN). Mit diesen Unterschieden hat das RBF-Modell ein einfacheres Design und seine Struktur ist fest und besteht nur aus drei Schichten. Es sollte auch beachtet werden, dass die Kategorisierungsmethoden zwischen MLP und RBF unterschiedlich sind. Die Datenwerte bei dieser Methode werden basierend auf dem Abstand der Punkte von den Punkten, die als Mittelpunkt bezeichnet werden, gewonnen. Die Auswahl der Zentren erfolgt auf drei verschiedene Arten: (a) beaufsichtigt, (b) unbeaufsichtigt und (c) fest. In jedem Neuron wirkt eine Transportfunktion, daher gilt für f(zi) = Ausgabe:

wobei sich die Terme \(\emptyset \left( {z_{i} } \right)\), \(w^{t}\) und \(b\) auf die Transportfunktion, die transponierte Gewichtsmatrix und den Bias-Vektor beziehen, jeweils.

Gleichung (13) zeigt die Gaußsche Funktion und ist im Allgemeinen die Transportfunktion in RBF-Modellen:

Weitere übliche Radialfunktionen sind:

Der Abstand des Punktes \(z_{i}\). vom Zentrum \(c_{k}\). wird als \(\left\| {z_{k} - c_{i} } \right\|\) dargestellt, also haben wir:

Die Anzahl der Eingaben und Kernel, Zentren und Gaußschen Transportfunktionen werden durch N, M, \(c_{k}\) symbolisiert. bzw. \(\varphi_{ik} \left( z \right)\).

Gemäß den obigen Aussagen werden Ausgaben erzielt durch54,55,56,57:

Das Schema des RBF-Modells und das Flussdiagramm für das vorgeschlagene RBF-Modell sind in den Abbildungen dargestellt. 3 bzw. 4. Der Ausbreitungskoeffizient und die maximale Anzahl von Neuronen in RBF betragen 2 bzw. 100. Darüber hinaus wurde in der vorliegenden Studie für das RBF-Modell die Gaußsche Funktion als Übertragungsfunktion verwendet.

Das schematische Diagramm von RBF.

Flussdiagramm für das vorgeschlagene RBF-Modell72.

MLP ist ein Feed-Forward-KNN, das mehrere Schichten haben kann. Ein einfaches MLP-Modell besteht aus mindestens drei Schichten. In diesem Fall verbindet eine verborgene Schicht die Eingabe- und Ausgabeschicht. Die Schichten bestehen aus Neuronen, mit Ausnahme der Eingabeschicht enthalten die Neuronen der anderen Schichten eine nichtlineare Aktivierungsfunktion. Die Anzahl der Schichten und Neuronen in jeder Schicht könnte unter Berücksichtigung der Anzahl der Eingabedaten und der Komplexität des Problems bestimmt werden. Das Erlernen dieses Netzwerks erfolgt mithilfe eines überwachten Backpropagation-Algorithmus. Gewichte und Bias sind die Parameter jedes Neurons. Als Übertragungsfunktion in versteckten Neuronen und Ausgabeneuronen können mehrere Funktionen verwendet werden. Einige dieser Funktionen werden im Folgenden vorgestellt:

In der vorliegenden Studie sind Purelin, Tansig und Logsig drei Übertragungsfunktionen, die für das MLP-Modell verwendet werden. Wie oben erwähnt, hat die erste Schicht eine lineare Funktion und die anderen haben eine nichtlineare Funktion. Beispielsweise wird die Ausgabe eines MLP-Modells mit zwei verborgenen Schichten wie folgt berechnet:

Dabei beziehen sich \(b_{1}\), \(b_{2}\) und \(b_{3}\) auf den ersten und zweiten Bias-Vektor der verborgenen Schicht bzw. den Bias der Ausgabeschicht. Matrizen der ersten und zweiten verborgenen Schicht und Ausgabeschicht werden auch mit \(w_{1}\), \(w_{2}\) und \(w_{3}\)54,55,57,58 bezeichnet. Schematische Darstellung eines MLP-Modells mit einer einzelnen versteckten Schicht, dargestellt in Abb. 5.

Das schematische Diagramm von MLP.

LSSVM wurde erstmals von Suykens und Vandewalle59 vorgeschlagen. In LSSVM wird ein Satz linearer Gleichungen gelöst; Daher haben wir eine Vereinfachung des Lernprozesses. Gl. (27) zeigt die Kostenfunktion der Support Vector Machine (SVM):

Hier stellt das hochgestellte T die Transportmatrix einer Variablen dar und We zeigt das Regressionsgewicht. Ein variabler Fehler des LSSVM-Algorithmus wird durch \(Ve_{j}^{2}\) dargestellt und Tu zeigt den Tuning-Parameter.

Unterliegt folgender Einschränkung:

Durch Gleichsetzen der Lagrange-Funktion des LSSVM mit Null und anschließender Verwendung der folgenden Formel könnten die Modellparameter erreicht werden:

Durch die Verwendung von Gl. (31) können die Parameter von LSSVM erreicht werden. Unbekannte Parameter in Gl. (31) sind We, c, \(Ve_{j}\) und \(\alpha_{j} .\)

\(Ve_{j}\) und \(\sigma^{2}\) steuern die Zuverlässigkeit von LSSVM. In dieser Studie beträgt der Betrag von Tu und \(\sigma^{2}\) 24,7959 bzw. 2,2514.

Um Daten im MLP-Modell zu trainieren, werden Trainingsalgorithmen verwendet, um Gewichte und Bias-Werte zu optimieren. Levenberg-Marquardt ist einer dieser Algorithmen, der zur Lösung nichtlinearer Probleme verwendet wird. Bei dieser Methode ist der Algorithmus in der Lage, die endgültige Antwort zu erhalten, selbst wenn es zu Beginn eine unangemessene Schätzung für Gewichte und Bias gibt. Da die Leistungsfunktion eine Summenquadratform hat, werden der Gradient und die Hesse-Matrizen wie folgt bestimmt:

Hier werden die Jacobi-Matrix und der Netzwerkfehlervektor mit \(J\) und \(e\) bezeichnet.

Durch Aktualisieren der Gleichungen werden die Gewichtswerte in jedem Schritt wie folgt erhalten:

Es ist zu beachten, dass \(\eta { }\) eine Konstante ist und aufgrund der Bedingung der Leistungsfunktion in jedem Schritt zunimmt oder abnimmt60.

Wie Levenberg-Marquardt wird auch der Bayes'sche Regularisierungsalgorithmus verwendet, um Gewichte und Bias zu optimieren und Fehlerquadrate zu minimieren. Gewichte werden wie folgt ermittelt:

wobei \(\alpha\), \(\beta\), \(E_{D}\), \(E_{w} { }\) und F(ω) Zielfunktionsparameter sind, Summe des Netzwerks Fehler, Summe der quadratischen Netzwerkgewichte bzw. Zielfunktion. Der Satz von Bayes wurde verwendet, um \(\alpha\) und \(\beta\) zu bestimmen. Darüber hinaus wurde die Gaußsche Verteilung verwendet, um sowohl Netzwerkgewichte als auch Trainingssätze zu entwickeln. Diese Parameter werden aktualisiert und der Vorgang wiederholt, bis die Konvergenz erreicht ist61.

Schapire62 führte die Boosting-Methode ein, eine Art Ensemble-Methode. Bei dieser Methode werden einige schwache Prädiktoren/Lernende kombiniert, um einen stärkeren Lernenden zu schaffen. Um frühere Lernende zu korrigieren, wird jeder schwache Lernende trainiert. Eine der beliebtesten Boosting-Arten ist das Gradient Boosting, das in diesem Artikel verwendet wird.

Gradient Boosting ist als eine Art von Boosting-Methoden bekannt. Bei dieser Art werden neue Lernende auf Restfehler angewendet, die von den vorherigen Lernenden gemacht wurden63. Der GB könnte als eine Form des funktionalen Gradientenabstiegs (FGD) betrachtet werden, bei dem ein spezifischer Verlust verringert wird, indem bei jedem Schritt des Gradientenabstiegs ein Lernender hinzugefügt wird64. Der Algorithmus von GB ist wie folgt:

Initialisiere \(g_{0} \left( y \right) = argmin_{\gamma} \mathop \sum \limits_{q = 1}^{Now} O\left( {x_{q} ,\gamma} \right )\)

Iteration für c = 1: C (C ist die Zahl der drei Lernenden

Berechnen Sie den negativen Gradienten \(a_{q} = \left[ {\frac{{\partial O(x_{q} ,g\left( {y_{q} } \right)}}{{\partial g\left ( {y_{q} } \right)}}} \right]_{{g = g_{c - 1} }} ,{ }q = 1,2, \ldots ,NU\)

Setze eine freie Regression \(F_{c} \left( y \right)\) zum Ziel \(\left\{ {a_{q} ,{ }q = 1,2, \ldots ,NU} \right\ }\)

Berechnen Sie die Schrittgröße des Gradientenabstiegs mit der folgenden Gleichung:

Aktualisieren Sie das Modell als \(g_{c} \left( y \right) = g_{c - 1} \left( y \right) + tF_{c} \left( y \right)\)

Für den Datentest (y,?) ist die Ausgabe \(g_{C} \left( y \right)\)

Die in dieser Studie verwendeten GB-Parameter sind in Tabelle 1 aufgeführt.

In dieser Forschung wurden 5040 Datenpunkte aus dem South Azadgan-Feld im Iran verwendet. Tabelle 2 zeigt die Vorverarbeitung dieses Datensatzes. In allen entwickelten Modellen sind Tiefe (D), Gewicht auf Bohrmeißel (WOB), Gesamtgrube (PT), Pumpendruck (PP), Hakenlast (H), Oberflächendrehmoment (ST), Drehzahl (RS) und Zufluss berücksichtigt (Fi), Durchfluss (Fo) und Bohrlochkopfdruck (Wp) wurden als Inputs betrachtet und ROP wird als Output betrachtet. Das Histogramm der Ein- und Ausgänge ist in Abb. 6 dargestellt. Wie in Abb. 6 dargestellt, liegen die meisten Daten des Oberflächendrehmoments zwischen 75 und 175 psi. Abbildung 6 zeigt, dass sich die Daten des Aus- und Einflusses zwischen 50–100 % bzw. 600–800 Gallonen/Minute ändern (Abb. 6). Die Hakenlastdaten schwankten zwischen 75 und 125 k-lbs und die meisten davon liegen bei 50 k-lbs (Abb. 6). Die Daten des Pumpendrucks und des Bohrlochkopfdrucks variieren von 1000 bis 2000 psi bzw. von 0 bis 10 psi (Abb. 6). Die Gesamtdaten der Grube liegen zwischen 200 und 280 Barrel (Abb. 6). Die meisten Weight-on-Bit-Daten liegen bei etwa 35 k-lbs (Abb. 6). Die meisten Drehzahldaten in unserer Studie lagen im Bereich von 25 bis 100 U/min. Der maximale ROP liegt in unseren Daten bei etwa 25 Fuß/h (Abb. 6). Abbildung 7 zeigt einen Boxplot der Eingabe- und Ausgabedaten. Wie in Abb. 7 dargestellt, liegt der Bereich der WOB-Daten unter 50, während die Gesamtdaten der Grube über 200 liegen. Die Daten der Hakenlast schwankten zwischen 50 und 100 (Abb. 7). Der Bereich des Oberflächendrehmoments und der Drehzahl liegt unter 150 bzw. 100. Darüber hinaus betragen der Ausflussbereich und der Bohrlochkopfdruck weniger als 100 bzw. 25 (Abb. 7). Wie in Abb. 7 dargestellt, liegen 25 bis 75 % der ROP-Daten unter 50. Abbildung 7 zeigt, dass der Pumpendruck zwischen 750 und mehr als 1500 variiert. Wie in Abb. 7 angegeben, sind alle Durchflussdaten geringer als 1000. Abbildung 8 zeigt die Beziehung zwischen ROP und Tiefe für unsere Daten. Wie in Abb. 8 dargestellt, nimmt der ROP mit zunehmender Tiefe ab.

Histogramm der Eingabe- und Ausgabedaten.

Boxplot der Eingabe- und Ausgabedaten.

Die Beziehung zwischen ROP und Tiefe.

Um den ROP anhand der Eingabeparameter zu schätzen, wurde im ersten Schritt die folgende Korrelation entwickelt und ihre Koeffizienten von GRG optimiert:

wobei a1–a31 Konstanten sind, die in Tabelle 3 aufgeführt sind. Wie in Gl. (34) sind alle beteiligten Parameter während des Bohrbetriebs verfügbar und werden aufgezeichnet. Daher kann diese Korrelation zur groben Schätzung des ROP verwendet werden. Obwohl die entwickelte Korrelation uns ein gutes Gefühl für ROP vermitteln kann, wird für eine gute ROP-Schätzung empfohlen, künstliche Intelligenz (KI) zu verwenden, die flexibler ist und komplizierte Probleme lösen kann. In dieser Studie wurden KI-Methoden verwendet, nämlich LSSVM, MLP, RBF und DT. Um KI-Modelle zu entwickeln, wurde die Datenbank zunächst zufällig in zwei Untergruppen aufgeteilt, die als Trainingssatz bekannt sind, in dem das Modell lernt und versucht, das beste und optimale Vorhersagemodell zu finden, und als Testsatz, der zur Untersuchung der Vorhersage verwendet wird Leistungsfähigkeit des entwickelten Modells. Die Klassifizierung der Datenpunkte für intelligente Modelle und die entwickelte Korrelation sind wie folgt:

80 Prozent der Daten wurden für das Training verwendet

20 Prozent der Daten wurden für Tests verwendet

LMA, BR und SCG sind die drei für das MLP-Modell entwickelten Algorithmen und GB ist die für das DT-Modell verwendete Optimierungstechnik.

Um die in dieser Studie entwickelten Modelle zu bewerten und zu vergleichen, wird eine statistische Fehleranalyse durchgeführt. Zu diesem Zweck werden die Werte der Standardabweichung (SD), des durchschnittlichen absoluten relativen Fehlers in Prozent (AAPRE), des Bestimmtheitsmaßes (R2), des quadratischen Mittelfehlers (RMSE) und des durchschnittlichen relativen Fehlers in Prozent (APRE) berechnet und die Die Ergebnisse sind in Tabelle 4 zusammengefasst. Die Gleichungen (35)–(39) stellen die Formel dar, die zur Berechnung der oben genannten Parameter verwendet wurde58,65.

Zwei geeignete statistische Fehler zum Vergleich der entwickelten Modelle sind AAPRE und R2. Wie in Tabelle 4 dargestellt, beträgt R2 der entwickelten Korrelation 0,807. Unter den verschiedenen MLP-Modellen erzielte dann BRA die beste Leistung, gefolgt von LMA und SCGA. R2 von MLP-SCGA, MLP-LMA und MLP-BRA betrugen 0,944, 0,965 bzw. 0,969. AAPRE dieser Modelle stimmt gut mit den R2-Ergebnissen überein, 13,88 % für MLP-BRA, 14,05 % für MLP-LMA und 18,49 % für MLP-SCGA. Wie in Tabelle 4 gezeigt, wies RBF unter den entwickelten Modellen die schlechteste Leistung auf. AAPRE und R2 dieses Modells betragen 21,409 % bzw. 0,937. R2 und AAPRE für LSSVM betragen 0,971 bzw. 10,497 %. Wie in Tabelle 4 angegeben, hatte DT-GB die beste Leistung unter den entwickelten Modellen. AAPRE für dieses Modell beträgt 9,013 % und sein R2 beträgt 0,977. Daher weist DT-GB die beste Leistung unter den entwickelten Modellen auf, gefolgt von LSSVM, MLP-BR, MLP-LM, MLP-SCG und RBF.

Abbildung 9 zeigt die Crossplots für die entwickelten Modelle. In diesen Diagrammen werden die Werte des modellierten ROP im Vergleich zu experimentellen Daten aufgetragen. Je mehr Daten rund um die Linie Y = X vorhanden sind, desto genauer wird das Modell sein. Mit anderen Worten: Die Linie Y = X ist ein visuelles Kriterium zur schnellen Überprüfung der Modellgenauigkeit. Der Parameter R2 gibt an, inwieweit die Datensätze der Linie Y = X entsprechen. Mit anderen Worten: Je näher R2 bei 1 liegt, desto bemerkenswerter ist der Grad der Übereinstimmung des Modells mit den experimentellen Daten. Unterdiagramm (a) von Abb. 9 zeigt Kreuzdiagramme der entwickelten Modelle. Wie in Teildiagramm (a) gezeigt, liefert die entwickelte Korrelation bis zu einem ROP von 50 eine akzeptable Vorhersage. Bei hohen ROP-Werten ist jedoch eine Streuung der Daten um die 45°-Linie offensichtlich. Wie in Teildiagramm (b) von Abb. 9 gezeigt, ist die Konzentration der Daten um die Einheitssteigungslinie, außer bei hohen ROP-Werten, für MLP-LMA gut. Die Konzentration des Trainingssatzes um die Steigungslinie der Einheit ist besser als der Testsatz im MLP-LMA-Modell. Die gleichen Ergebnisse wurden für MLP-BRA erzielt; Allerdings ist bei MLP-BRA eine bessere Konzentration der Daten zu beobachten als bei MLP-LMA (Unterdiagramm (c) von Abb. 9). Für MLP-SCGA ist jedoch eine Streuung der Daten offensichtlich (Unterdiagramm (d) von Abb. 9). Die Streuung des Testsatzes ist offensichtlich und weitaus größer als die der Trainingsdaten. In der Teildarstellung (e) von Abb. 9 ist zu erkennen, dass die Schätzungen des RBF-Modells um die Y = X-Linie verstreut sind. Die Streuung der Testdaten sowohl bei hohen als auch bei niedrigen ROP-Werten ist offensichtlich. Obwohl die Streuung der Testdaten offensichtlich ist, ist die Konzentration der Trainingsdaten um die Linie Y = gehört zu DT-GB. Wie im Unterdiagramm (g) von Abb. 9 gezeigt, ist die Konzentration der Daten um die 45°-Gerade gut.

Kreuzdiagramme der implementierten intelligenten Modelle.

Die Fehlerverteilung der vorgeschlagenen Korrelation und der entwickelten Modelle ist in Abb. 10 dargestellt. In jedem Unterdiagramm wird der prozentuale relative Fehler gegen die Durchdringungsrate aufgetragen. Unterdiagramm (a) von Abb. 10 zeigt, dass die entwickelte Korrelation bei niedrigen ROP-Werten eine vernünftige Vorhersage liefert und die Konzentration der Datenpunkte um die Null-Fehler-Linie gut ist. Wie in Teildiagramm (b) von Abb. 10 gezeigt, ist die Konzentration der Datensätze um die Null-Fehler-Linie geeignet. Darüber hinaus zeigt Teildiagramm (c) von Abb. 10 eine viel bessere Konzentration der Daten für MLP-BRA um die Nullfehlerlinie als für MLP-LMA. Allerdings ist die Konzentration der Datenpunkte, die vom Modell MLP-SCGA geschätzt werden, um die Nullfehlerlinie herum nicht so gut wie bei den beiden anderen MLP-Modellen (Unterdiagramm (d) von Abb. 10). Die statistische Analyse zeigte, dass die Leistung von RBF nicht gut ist. Sowohl das Kreuzdiagramm als auch die Fehlerverteilung des RBF bestätigten diesen Befund (Unterdiagramm (e) von Abb. 10). Wie in der Teildarstellung (f) von Abb. 10 dargestellt, ist die Abstimmung der Trainingsdaten um die Null-Fehler-Linie für das LSSVM-Modell zufriedenstellend, obwohl die Konzentration der Testdaten an einigen Punkten nicht gut war. Wie im Unterdiagramm (e) von Abb. 10 dargestellt, zeigen die Vorhersagen von DT-GB sowohl bei hohen als auch bei niedrigen ROP-Werten eine sehr angemessene Konzentration um die Nullfehlerlinie. Die Nebendarstellung (e) von Abb. 10 unterstützt die Überlegenheit von DT-GB.

Fehlerverteilungsdiagramme der vorgeschlagenen Modelle.

Abbildung 11 zeigt den Vergleich zwischen experimentellem ROP und ROP-Vorhersagewerten durch das DT-GB-Modell für die ersten 100 Testdatenpunkte. Wie in Abb. 11 dargestellt, weist das in dieser Studie am besten entwickelte Modell, DT-GB, gute Vorhersagen auf. Mit Ausnahme einiger Datenpunkte stimmen die Vorhersagen von DT-GB gut mit dem experimentellen ROP überein.

Vergleich der experimentellen Daten und Ausgabe des DT-GB-Modells für die ersten 100 Testdatenpunkte.

Abbildung 12 zeigt den Vergleich statistischer Fehler für entwickelte Modelle anhand eines Balkendiagramms. Jedes Unterdiagramm in Abb. 12 bestätigt, dass DT-GB bzw. RBF die beste und schlechteste Leistung aufweisen.

Vergleich statistischer Fehler der intelligenten Modelle.

Ein 3D-Diagramm des absoluten relativen Fehlers des DT-GB-Modells im Vergleich zu verschiedenen Parametern, einschließlich Hakenlast, Tiefe, ROP und WOB, ist in Abb. 13 dargestellt. Wie in Unterdiagramm (a) von Abb. 13 gezeigt, beträgt der maximale absolute relative Fehler sichtbar, wenn der WOB etwa 18 k-lbs und die Tiefe 4000 Fuß beträgt. In der Teildarstellung (b) von Abb. 13 wird der maximale absolute relative Fehler gemeldet, sobald der ROP 14 Fuß/h beträgt und die Tiefe 4000 Fuß beträgt. Außerdem weist das Modell bei einer Hakenlast von 90 k-lbs und einer Tiefe von 4000 Fuß einen hohen Fehler auf.

Absolute relative Fehlerkontur im Vergleich zu verschiedenen Parametern (a) WOB und Tiefe (b) ROP und Tiefe (c) Hakenlast und Tiefe.

Abbildung 14 zeigt die kumulative Häufigkeit im Vergleich zum absoluten relativen Fehler. Über 50 % der von DT-GB-Modellen vorhergesagten ROP-Werte weisen einen absoluten relativen Fehler von weniger als 10 % auf. 50 % der von LSSVM vorhergesagten ROP weisen einen Fehler von weniger als 10 % auf. Etwa 50 % der von MLP-LMA- und MLP-BR-Modellen vorhergesagten Werte weisen einen absoluten relativen Fehler von weniger als 10 % auf. Für MLP-SCG und RBF weisen etwa 40 % bzw. etwa 30 % der vorhergesagten ROP-Werte einen absoluten relativen Fehler von weniger als 10 % auf.

Kumulative Häufigkeit vs. absoluter relativer Fehler verschiedener in dieser Studie vorgeschlagener Modelle.

Eine Sensitivitätsanalyse wurde untersucht, um die quantitativen Auswirkungen aller Eingabeparameter auf den ROP des entwickelten Modells zu untersuchen. Zu diesem Zweck wurde ein Relevanzfaktor mit Direktionalität (r) gewählt. Der Wert von r und sein Vorzeichen zeigen den Grad der Auswirkung der Eingabe auf die Ausgabe des Modells bzw. die Auswirkungsrichtung66. Die folgende Formel zeigt die Definition von r:

In der obigen Gleichung zeigen \(In_{k}\) und \(OU\) die n-te Eingabe des Modells bzw. den vorhergesagten ROP. Die relative Auswirkung der Eingangsvariablen auf den ROP, der durch das vorgeschlagene DT-GB-Modell geschätzt wird, ist in Abb. 15 dargestellt. Wie in Abb. 15 gezeigt, wirken sich Grubengesamtheit, Drehzahl und Zufluss positiv auf den ROP aus Tiefe, Gewicht auf dem Bohrer, Pumpendruck, Hakenlast, Oberflächendrehmoment und Bohrlochkopfdruck haben negative Auswirkungen auf den ROP. Der höchste absolute Wert von r gehört zur Tiefe; Daher hat die Tiefe unter den Eingaben den größten Einfluss auf den vorhergesagten ROP-Wert.

Der relative Effekt von Eingabevariablen auf den ROP basierend auf dem DT-GB-Modell.

Ausreißer sind Daten, die von der Masse der Daten abweichen können. Häufig wird erwartet, dass diese Art von Daten in großen experimentellen Datenmengen auftauchen. Das Vorhandensein solcher Daten kann die Genauigkeit und Zuverlässigkeit von Modellen beeinträchtigen. Daher ist das Auffinden dieser Daten bei der Entwicklung von Modellen notwendig67,68,69,70,71. In dieser Studie wurde der Leverage-Ansatz zur Bestimmung von Ausreißern eingesetzt67,69,70,71. Bei dieser Methode wurde die Abweichung des vorhergesagten Werts von den entsprechenden experimentellen Daten berechnet. Weitere Einzelheiten zu dieser Methode finden Sie in der Literatur67,68,69,70.

Abbildung 16 zeigt das Williams-Diagramm für den vorhergesagten ROP, der mit dem DT-GB-Modell ermittelt wurde. Die in Abb. 16 dargestellten Daten zu nicht genutzten Hebelwirkungen und vermuteten Daten sind in Tabelle 5 zu finden. Wie in Abb. 16 dargestellt, sind die meisten Datenpunkte im Anwendbarkeitsbereich positioniert (− 3 ≤ R ≤ 3 und 0 ≤ hat ≤ 0,0057). Daher weist das entwickelte Modell DT-GB statistische Gültigkeit und hohe Zuverlässigkeit auf. Eine kleine Datenmenge liegt außerhalb des Anwendungsbereichs, was vernachlässigbar ist. In dieser Darstellung haben wir zwei wichtige Definitionen: „Guter hoher Hebel“ und „Schlecht hoher Hebel“. Als gute High-Leverage-Daten werden Daten bezeichnet, deren R zwischen 3 und -3 liegt und deren Hat* ≤ Hat. Diese Datenpunkte unterscheiden sich von der Masse der Daten und liegen außerhalb des Machbarkeitsbereichs des entwickelten Modells, können jedoch vom entwickelten Modell gut vorhergesagt werden. Wenn R der Daten kleiner als -3 oder größer als 3 sind, werden diese Daten als Bad High Leverage bezeichnet. Bei diesen Daten handelt es sich um experimentell zweifelhafte Daten oder Ausreißer67,68,69,70.

Williams Diagramm zur Ermittlung der wahrscheinlichen Ausreißer und des Machbarkeitsbereichs des entwickelten Modells DT-GB in dieser Studie.

In dieser Studie wurden neue Methoden zur Vorhersage der Bohrraten eingesetzt. Da die Parameter, die die Bohrgeschwindigkeit beeinflussen, unterschiedlich sind und die Bedingungen von Feld zu Feld variieren, ist es immer schwierig, ein umfassendes, effizientes und präzises Modell zu entwickeln. Das Modell, das mehr Parameter berücksichtigen kann, könnte die Bohrgeschwindigkeit besser vorhersagen. Daher haben wir versucht, eine Korrelation und intelligente Modelle einschließlich MLP, RBF, LSSVM und DT mit zehn Eingabeparametern zu entwickeln. Die wichtigsten Ergebnisse dieser Studie sind wie folgt:

Die entwickelten Korrelations- und Smart-Modelle benötigen Parameter, die vor Ort zugänglich sind und eine schnelle Vorhersage des ROP ermöglichen.

Alle vier intelligenten Modelle verfügen über eine gute Vorhersage der Bohrraten, was die Tendenz erhöhen würde, intelligente Methoden zur Vorhersage der Bohrraten zu verwenden.

Die besten Vorhersagen stammen vom DT-GB-Modell mit einem R2 von 0,977. Darüber hinaus weist das LSSVM-Modell eine akzeptable Leistung auf. R2 dieses Modells betrug 0,969. Darüber hinaus weisen MLP-Modelle eine gute Leistung auf, und schließlich weist RBF die schlechteste Leistung unter den entwickelten Modellen auf.

Die Sensitivitätsanalyse zeigte, dass Zufluss, Drehzahl und Grubengesamtzahl positive Auswirkungen auf den ROP haben, während andere Parameter negative Auswirkungen haben. Unter den Eingabeparametern hat die Tiefe den größten Einfluss auf ROP.

Der Leverage-Ansatz zeigte, dass das entwickelte DT-GB-Modell statistisch gültig ist und nur wenige Datenpunkte außerhalb des Anwendbarkeitsbereichs des Modells liegen.

Radialbasisfunktion

Entscheidungsbaum

Mehrschichtiges Perzeptron

Levenberg_Marquardet-Algorithmus

Bayesianischer Regularisierungsalgorithmus

Skalierter konjugierter Gradientenalgorithmus

Gradientenverstärkung

Durchschnittlicher prozentualer relativer Fehler

Durchschnittlicher absoluter relativer Fehler

Mittlerer quadratischer Fehler

Standardabweichung

Maschinelles Lernen

Bourgoyne- und Yong-Modell

Gewicht auf Gebiss

Künstliche neuronale Netz

Tiefe

Grube insgesamt

Pumpendruck

Hakenlast

Oberflächendrehmoment

Drehzahl

Fließen in

Ausströmen

Bohrlochdruck

Automatische Interaktionserkennung

Künstliche Intelligenz

Revolutionen pro Minute

Einachsige Druckfestigkeit

Plastische Viskosität

Schlammgewicht

Fließgrenze

Extreme Lernmaschine

Automatische Interaktionserkennung von Theta

Generalisierter reduzierter Gradient

Kleinste quadratische Unterstützungsvektormaschine

Polykristalliner Diamantkompakt

Unterstützung der Vektorregression

Das Komitee unterstützt die Vektorregression basierend auf dem imperialistischen Wettbewerbsalgorithmus

Computational Intelligence-Techniken

Kleinste-Quadrat-Unterstützungsvektorregression

Adaptives Neuro-Fuzzy-Inferenzsystem

Support-Vektor-Maschine

Bahari, MH, Bahari, A. & Moradi, H. Intelligenter Bohrgeschwindigkeitsvorhersager. Int. J. Innov. Berechnen. Inf. Kontrolle. 7(2), 1511–20 (2011).

Google Scholar

Hadi, HA & Engineering, P. Korrelation der Penetrationsrate mit Bohrparametern für ein irakisches Feld unter Verwendung von Schlammprotokollierungsdaten. Irakischer J. Chem. Benzin. Ing. 16(3), 35–44 (2015).

Google Scholar

Kaiser, MJ Technologie: Eine Übersicht über Bohrkosten- und Komplexitätsschätzungsmodelle. Int. J. Benzin. Wissenschaft. Technol. 1(1), 1–22 (2007).

MathSciNet Google Scholar

Barbosa, LFF, Nascimento, A., Mathias, MH & de Carvalho Jr, JA Methoden des maschinellen Lernens, angewendet auf die Vorhersage und Optimierung der Bohrgeschwindigkeit der Penetration: eine Übersicht. J. Benzin. Wissenschaft. Ing. 183, 106332 (2019).

Artikel CAS Google Scholar

Metropolis, N., Rosenbluth, AW, Rosenbluth, MN, Teller, AH & Teller, E. Gleichung von Zustandsberechnungen durch schnelle Rechenmaschinen. J. Chem. Physik. 21(6), 1087–1092 (1953).

Artikel ADS CAS MATH Google Scholar

Soares, C. & Gray, K. Echtzeit-Vorhersagefähigkeiten von ROP-Modellen (Rate of Penetration) für analytisches und maschinelles Lernen. J. Benzin. Wissenschaft. Ing. 172, 934–959 (2019).

Artikel CAS Google Scholar

Akgun, F. Bohrleistung am technischen Limit. J. Benzin. Wissenschaft. Technol. 1(1), 99–119 (2007).

Google Scholar

Bataee, M., Irawan, S. & Kamyab, M. Künstliches neuronales Netzwerkmodell zur Vorhersage der Bohrdurchdringungsrate und Optimierung von Parametern. J. Jpn. Benzin. Inst. 57(2), 65–70 (2014).

Artikel CAS Google Scholar

Paone, J., Madson, D. Bohrbarkeitsstudien: Imprägnierte Diamantbohrkronen. Innenministerium, Bureau of Mines (1966).

Khosravanian, R., Sabah, M., Wood, DA & Shahryari, A. Gewichtung von Bohrervorhersagemodellen: Fuzzy-Inferenzsysteme vom Sugeno-Typ und Mamdani-Typ im Vergleich. J. Nat. Gaswissenschaft. Ing. 36, 280–97 (2016).

Artikel CAS Google Scholar

Paone, J., Bruce, WE, Virciglio, PR Drillability Studies: Statistische Regressionsanalyse von Diamantbohrungen. US-Innenministerium, Bureau of Mines (1966).

Ayoub, M., Shien, G., Diab, D. & Ahmed, Q. Modellierung der Bohrdurchdringungsrate mithilfe eines adaptiven Neuro-Fuzzy-Inferenzsystems. Int J Appl Eng Res 12(22), 12880–91 (2017).

Google Scholar

Ersoy, A., Waller, M. Vorhersage der Bohrerleistung mithilfe einer linearen Regressionsanalyse mit mehreren Variablen. Im International Journal of Rock Mechanics and Mining Sciences und Geomechanics Abstracts. 6, 279A (1995).

Mendes, JRP, Fonseca, TC, Serapião, A. Anwendung eines adaptiven Referenzreglers für genetische Neuromodelle bei der Bohroptimierung. 29–36 (2007).

Mitchell, R., Miska, S. Grundlagen der Bohrtechnik; Society of Petroleum Engineers, Inc.: Richardson, TX, USA, 2011; Kapitel 4. Google Scholar.

Maurer, W. Die Theorie der „perfekten Reinigung“ des Drehbohrens. J. Benzin. Technol. 14(11), 1270–1274 (1962).

Artikel Google Scholar

Bingham G. Ein neuer Ansatz zur Interpretation der Bohrbarkeit von Gestein. Technik. Manual Reprint Oil Gas J., 93, 1965 (1965).

Bourgoyne, Jr. AT, Millheim, KK, Chenevert, ME, Young, Jr FS Angewandte Bohrtechnik. (1991).

Bourgoyne, AT Jr. & Young, F. Jr. Ein multipler Regressionsansatz für optimales Bohren und Erkennung abnormaler Drücke. Soc. Benzin. Ing. J. 14(04), 371–384 (1974).

Artikel Google Scholar

Eren, T. & Ozbayoglu, ME Echtzeitoptimierung von Bohrparametern während Bohrarbeiten (Society of Petroleum Engineers, 2010).

Buchen Sie Google Scholar

Hareland, G., Rampersad, P. Drag-Bit-Modell inklusive Verschleiß. Auf der SPE Latin America/Caribbean Petroleum Engineering Conference. Gesellschaft der Erdölingenieure; 1994.

Soares, C., Daigle, H. & Gray, K. Bewertung von PDC-Bit-ROP-Modellen und der Auswirkung der Gesteinsfestigkeit auf Modellkoeffizienten. J. Nat. Gaswissenschaft. Ing. 34, 1225–1236 (2016).

Artikel Google Scholar

Motahhari, HR, Hareland, G. & James, J. Verbesserte Bohreffizienztechnik durch integrierte PDM- und PDC-Bohrerparameter. J. Can. Haustier. Technol. 49(10), 45–52 (2010).

Artikel Google Scholar

Deng, Y., Chen, M., Jin, Y., Zhang, Y., Zou, D., Lu, Y., et al. Theoretische und experimentelle Untersuchung der Eindringgeschwindigkeit von Rollenkegelmeißeln basierend auf der dynamischen Gesteinsfestigkeit und den Bohrparametern. 36, 117–123 (2016).

Al-AbdulJabbar, A., Elkatatny, S., Mahmoud, M., Abdelgawad, K., Al-Majed, A. Ein robustes Penetrationsratenmodell für die Karbonatbildung. J. Energieressource. Technol. 141(4) (2019).

Elkatatny, S. Neuer Ansatz zur Optimierung der Penetrationsrate mithilfe eines künstlichen neuronalen Netzwerks. 1–8 (2017).

Warren, TJSDE Penetrationsleistung von Rollenkegelmeißeln. 2(01):9–18 (1987).

Hareland, G., Hoberock, L. Verwendung von Bohrparametern zur Vorhersage von In-situ-Spannungsgrenzen. Auf der SPE/IADC-Bohrkonferenz. Gesellschaft der Erdölingenieure (1993).

Hareland, G., Wu, A., Rashidi, B. Ein Bohrgeschwindigkeitsmodell für Rollenkegelmeißel und seine Anwendung. Auf der internationalen Öl- und Gaskonferenz und Ausstellung in China. Gesellschaft der Erdölingenieure (2010).

Hareland G, Wu A, Rashidi B, James J. Ein neues Bohrgeschwindigkeitsmodell für Tricone-Bohrkronen und seine Anwendung zur Vorhersage der Druckfestigkeit von Gesteinen. Im 44. US Rock Mechanics Symposium und 5. US-Canada Rock Mechanics Symposium. American Rock Mechanics Association (2010).

Eckel JR. Microbit-Studien zum Einfluss von Flüssigkeitseigenschaften und Hydraulik auf die Bohrgeschwindigkeit, ii. Im Herbsttreffen der Society of Petroleum Engineers von AIME. Gesellschaft der Erdölingenieure; 1968.

Paiaman, AM, Al-Askari, M., Salmani, B., Alanazi, BD, Masihi, MJN Einfluss der Bohrflüssigkeitseigenschaften auf die Penetrationsrate. 60(3), 129–34 (2009).

Moraveji, MK, Naderi, M. Bohrgeschwindigkeit der Penetrationsvorhersage und -optimierung mithilfe der Reaktionsoberflächenmethodik und des Fledermausalgorithmus. 31, 829–41 (2016).

Arabjamaloei, R. & Shadizadeh, S. Modellierung und Optimierung der Penetrationsrate mithilfe intelligenter Systeme in einem südlichen iranischen Ölfeld (Ahwaz-Ölfeld). Haustier. Wissenschaft. Technol. 29(16), 1637–1648 (2011).

Artikel CAS Google Scholar

Amar, K., Ibrahim, A. Vorhersage und Optimierung der Penetrationsrate mithilfe von Fortschritten in künstlichen neuronalen Netzen, eine vergleichende Studie. In 4. International Joint Conference on Computational Intelligence, 647–52 (2012).

Hegde, C., Daigle, H., Millwater, H. & Gray, K. Analyse der Vorhersage der Penetrationsrate (ROP) beim Bohren mithilfe physikbasierter und datengesteuerter Modelle. J. Benzin. Wissenschaft. Ing. 159, 295–306 (2017).

Artikel CAS Google Scholar

Bilgesu, H., Tetrick, L., Altmis, U., Mohaghegh, S. & Ameri, S. Ein neuer Ansatz zur Vorhersage von Werten der Penetrationsrate (ROP) (Society of Petroleum Engineers, 1997).

Buchen Sie Google Scholar

AlArfaj, I., Khoukhi, A., Eren, T. Anwendung fortschrittlicher rechnerischer Intelligenz zur Vorhersage der Penetrationsrate. In Computer Modeling and Simulation (EMS), 2012 Sechstes UKSim/AMSS Europäisches Symposium zum Thema. IEEE; 33–38 (2012).

Ansari, HR, Hosseini, MJS & Amirpour, M. Drilling-Rate der Penetrationsvorhersage durch Komitee-Unterstützungsvektor-Regression basierend auf einem imperialistischen Wettbewerbsalgorithmus. Carbonates Evaporites 32(2), 205–213 (2017).

Artikel Google Scholar

Ashrafi, SB, Anemangely, M., Sabah, M. & Ameri, MJ Anwendung hybrider künstlicher neuronaler Netze zur Vorhersage der Penetrationsrate (ROP): eine Fallstudie aus dem Marun-Ölfeld. J. Benzin. Wissenschaft. Ing. 175, 604–623 (2019).

Artikel CAS Google Scholar

Diaz, MB, Kim, KY, Shin, H.-S. & Zhuang, L. Vorhersage der Penetrationsrate beim Bohren einer tiefen Geothermiebohrung in Korea mithilfe künstlicher neuronaler Netze und Echtzeit-Datenerfassung. J. Nat. Gaswissenschaft. Ing. 67, 225–232 (2019).

Artikel Google Scholar

Gan, C. et al. Vorhersage der Bohrdurchdringungsrate (ROP) mithilfe der Hybrid-Support-Vektor-Regression: eine Fallstudie zum Shennongjia-Gebiet in Zentralchina. J. Benzin. Wissenschaft. Ing. 181, 106200 (2019).

Artikel CAS Google Scholar

Mehrad, M., Bajolvand, M., Ramezanzadeh, A., Neycharan, JG Entwicklung eines neuen, strengen Bohrratenvorhersagemodells mithilfe einer Technik des maschinellen Lernens. J. Benzin. Wissenschaft. Ing. 107338 (2020).

Gill, PE, Murray, W., Wright, MH Praktische Optimierung. Academic Press, New York (1981).

Ameli, F., Hemmati-Sarapardeh, A., Dabir, B. & Mohammadi, AH Bestimmung der Asphalten-Ausfällungsbedingungen während der natürlichen Erschöpfung von Öllagerstätten: ein robuster kompositorischer Ansatz. Flüssigkeitsphasengleichgewicht. 412, 235–248 (2016).

Artikel CAS Google Scholar

Wilde, DJ, Beightler, CS Grundlagen der Optimierung (1967).

Sharma, R. & Glemmestad, B. Über die verallgemeinerte Methode des reduzierten Gradienten mit mehrstartiger und selbstoptimierender Kontrollstruktur zur Optimierung der Gasliftzuteilung. J. Process Control 23(8), 1129–1140 (2013).

Artikel CAS Google Scholar

David, CY, Fagan, JE, Foote, B. & Aly, AA Eine optimale Lastflussstudie nach dem verallgemeinerten Ansatz mit reduziertem Gradienten. Elektrisches Energiesystem. Res. 10(1), 47–53 (1986).

Artikel Google Scholar

Abadie, J. Verallgemeinerung der Wolfe-reduzierten Gradientenmethode auf den Fall nichtlinearer Einschränkungen. Optimierung 37–47 (1969).

Morgan, JN & Sonquist, JA Probleme bei der Analyse von Umfragedaten und ein Vorschlag. Marmelade. Stat. Assoc. 58(302), 415–434 (1963).

Artikel MATH Google Scholar

Messenger, R. & Mandell, L. Eine modale Suchtechnik für die prädiktive multivariate Analyse im nominalen Maßstab. Marmelade. Stat. Assoc. 67(340), 768–772 (1972).

Google Scholar

Song, Y.-Y. & Ying, L. Entscheidungsbaummethoden: Anwendungen zur Klassifizierung und Vorhersage. Shanghai-Bogen. Psychiatrie 27(2), 130 (2015).

PubMed PubMed Central Google Scholar

Patel N, Upadhyay S. Untersuchung verschiedener Methoden zum Beschneiden von Entscheidungsbäumen mit ihrem empirischen Vergleich in WEKA. Int. J. Comput. Appl. 60(12) (2012).

Ameli, F., Hemmati-Sarapardeh, A., Schaffie, M., Husein, MM, Shamshirband, SJF Modellierung der Grenzflächenspannung in N 2/n-Alkan-Systemen unter Verwendung der entsprechenden Zustandstheorie: Anwendung auf Gasinjektionsprozesse. 222, 779–791 (2018).

Hemmati-Sarapardeh, A., Varamesh, A., Husein, MM, Karan, KJR, Reviews, SE Zur Bewertung der Viskosität von Nanofluidsystemen: Modellierung und Datenbewertung. 81, 313–329 (2018).

Karkevandi-Talkhooncheh, A., Rostami, A., Hemmati-Sarapardeh, A., Ahmadi, M., Husein, MM, Dabir, BJF Modellierung des minimalen Mischbarkeitsdrucks während der Flutung mit reinem und unreinem CO2 unter Verwendung eines Hybrids aus neuronalen Netzwerken mit radialer Basisfunktion und Evolutionäre Techniken. 220, 270–282 (2018).

Varamesh, A., Hemmati-Sarapardeh, A., Dabir, B., Mohammadi, AH Entwicklung robuster verallgemeinerter Modelle zur Schätzung der normalen Siedepunkte reiner chemischer Verbindungen. 242, 59–69 (2017).

Rostami, A., Hemmati-Sarapardeh, A., Shamshirband, SJF Genaue Prognose der Erdgasviskosität: Intelligente Modellierung und vergleichende Studie. 222, 766–778 (2018).

Suykens, JA & Vandewalle, J. Kleinste Quadrate unterstützen Vektormaschinenklassifikatoren. Neuronaler Prozess. Lette. 9(3), 293–300 (1999).

Artikel Google Scholar

Hagan, MT & Menhaj, MB Training von Feedforward-Netzwerken mit dem Marquardt-Algorithmus. IEEE Trans. Neural Networks 5(6), 989–993 (1994).

Artikel CAS PubMed Google Scholar

Yue, Z., Songzheng, Z., Tianshi, L. Bayesianisches Regularisierungsmodell des BP Neural Network zur Vorhersage der Kosten für Öl- und Gasbohrungen. Im Jahr 2011 Internationale Konferenz für Unternehmensführung und elektronische Information. 2. IEEE; 483–487 (2011).

Schapire, RE Die Stärke schwacher Lernfähigkeit. Mach. Lernen. 5(2), 197–227 (1990).

Google Scholar

Hastie, T., Tibshirani, R. & Friedman, J. Die Elemente des statistischen Lernens (Springer, 2009).

Buchen Sie MATH Google Scholar

Friedman, JH Stochastische Gradientenverstärkung. Berechnen. Stat. Daten Anal. 38(4), 367–378 (2002).

Artikel MathSciNet MATH Google Scholar

Rostami, A., Baghban, A., Mohammadi, AH, Hemmati-Sarapardeh, A., Habibzadeh, SJF Strenge Prognose der Permeabilität heterogener Karbonatöllagerstätten: Intelligente Modellierung und Korrelationsentwicklung. 236, 110–123 (2019).

Tohidi-Hosseini, S.-M., Hajirezaie, S., Hashemi-Doulatabadi, M., Hemmati-Sarapardeh, A. & Mohammadi, AH Auf dem Weg zur Vorhersage der Eigenschaften von Erdöllagerstättenflüssigkeiten: ein strenges Modell zur Abschätzung der Gas-Öl-Lösung Verhältnis. J. Nat. Gaswissenschaft. Ing. 29, 506–516 (2016).

Artikel Google Scholar

Leroy, AM, Rousseeuw, PJ Robuste Regression und Ausreißererkennung. rrod (1987).

Hemmati-Sarapardeh, A., Ameli, F., Dabir, B., Ahmadi, M. & Mohammadi, AH Zur Auswertung von Asphalten-Ausfällungstitrationsdaten: Modellierung und Datenbewertung. Flüssigkeitsphasengleichgewicht. 415, 88–100 (2016).

Artikel CAS Google Scholar

Goodall, CR 13 Berechnung mithilfe der QR-Zerlegung (1993).

Gramatica, P. Prinzipien der QSAR-Modellvalidierung: intern und extern. QSAR-Kombination. Wissenschaft. 26(5), 694–701 (2007).

Artikel CAS Google Scholar

Mohammadi, AH, Eslamimanesh, A., Gharagheizi, F. & Richon, D. Eine neuartige Methode zur Auswertung von Asphalten-Ausfällungstitrationsdaten. Chem. Ing. Wissenschaft. Rev. 78, 181–185 (2012).

Artikel CAS Google Scholar

Mehrjoo, H., Riazi, M., Amar, MN, Hemmati-Sarapardeh, A. Modellierung der Grenzflächenspannung von Methan-Sole-Systemen bei hohem Druck und hohem Salzgehalt. J. Taiwan Inst. Chem. Ing. (2020).

Referenzen herunterladen

Abteilung für Erdöltechnik, Shahid Bahonar University of Kerman, Kerman, Iran

Mohsen Riazi, Hossein Mehrjoo, Hossein Jalalifar und Abdolhossein Hemmati-Sarapardeh

Forschungszentrum für Enhanced Oil Recovery (EOR), IOR/EOR-Forschungsinstitut, Universität Shiraz, Shiraz, Iran

Mohsen Riazi, Reza Nakhaei und Masoud Riazi

Abteilung für Systemtechnik, School of Higher Technology, Montreal, QC, Kanada

Mohammadhadi Shateri

Schlüssellabor für kontinentale Schieferkohlenwasserstoffakkumulation und effiziente Entwicklung, Bildungsministerium, Northeast Petroleum University, Daqing, 163318, China

Mehdi Ostadhassan

Institut für Geowissenschaften, Meeres- und Landgeomechanik und Geotektonik, Christian-Albrechts-Universität, 24118, Kiel, Deutschland

Mehdi Ostadhassan

Abteilung für Geologie, Ferdowsi-Universität Mashhad, Mashhad, Iran

Mehdi Ostadhassan

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

MR: Untersuchung, Modellierung, Visualisierung, Schreiben – Originalentwurf, HM: Untersuchung, Validierung, Schreiben – Originalentwurf, RN: Schreiben – Überprüfung und Bearbeitung, Experimente, HJ: Schreiben – Überprüfung und Bearbeitung, Validierung, Supervision, MS: Schreiben – Review & Editing, Modellierung, MR: Writing-Review & Editing, Validierung, Supervision, MO: Writing-Review & Editing, Validierung, Finanzierung, AH-S.: Writing-Review & Editing, Methodik, Validierung, Supervision, Writing-Review & Bearbeitung.

Korrespondenz mit Abdolhossein Hemmati-Sarapardeh.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Springer Nature bleibt neutral hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die Originalautor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Riazi, M., Mehrjoo, H., Nakhaei, R. et al. Modellierung der Penetrationsrate bei Bohrvorgängen mithilfe der Modelle RBF, MLP, LSSVM und DT. Sci Rep 12, 11650 (2022). https://doi.org/10.1038/s41598-022-14710-z

Zitat herunterladen

Eingegangen: 02. August 2021

Angenommen: 10. Juni 2022

Veröffentlicht: 08. Juli 2022

DOI: https://doi.org/10.1038/s41598-022-14710-z

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein gemeinsam nutzbarer Link verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.