Kollationen in Babelfish für Aurora Postgre verstehen SQL - Amazon Aurora

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Kollationen in Babelfish für Aurora Postgre verstehen SQL

Wenn Sie mit Babelfish einen Aurora SQL Postgre-DB-Cluster erstellen, wählen Sie eine Kollation für Ihre Daten. Eine Sortierung gibt die Sortierreihenfolge und Bitmuster an, die den Text oder die Zeichen in einer bestimmten menschlichen Schriftsprache erzeugen. Eine Sortierung enthält Regeln zum Vergleich von Daten für einen bestimmten Satz von Bitmustern. Die Sortierung bezieht sich auf die Lokalisierung. Verschiedene Gebietsschemas wirken sich auf die Zeichenzuordnung, die Sortierreihenfolge und dergleichen aus. Sortierattribute spiegeln sich in den Namen verschiedener Sortierungen wider. Weitere Informationen zu den Attributen finden Sie unter Babelfish collation attributes table.

Babelfish ordnet SQL Server-Sortierungen vergleichbaren Kollationen von Babelfish zu. Babelfish definiert Unicode-Sortierungen mit kulturell sensiblen Zeichenfolgenvergleiche und Sortierreihenfolge vorab. Babelfish bietet auch eine Möglichkeit, die Kollationen in Ihrer Server-DB in die Babelfish-Kollatierung zu übersetzen, die am ehesten übereinstimmt. SQL Lokalspezifische Sortierungen werden für verschiedene Sprachen und Regionen bereitgestellt.

Einige Sortierungen geben eine Codepage an, die einer clientseitigen Kodierung entspricht. Babelfish wird abhängig von der Sortierung jeder Ausgabespalte automatisch von der Servercodierung in die Clientcodierung übersetzt.

Babelfish unterstützt die Sortierungen, die in der Babelfish supported collations table aufgeführt sind. Babelfish ordnet Server-Sortierungen vergleichbaren Kollationen von Babelfish zu. SQL

Babelfish verwendet Version 153.80 der Kollationsbibliothek International Components for Unicode (). ICU Weitere Informationen zu ICU Kollationen finden Sie in der Dokumentation unter Sortierung. ICU Weitere Informationen zu Postgre SQL und Collation finden Sie unter Collation Support in der Postgre-Dokumentation. SQL

DB-Cluster-Parameter, die die Sortierung und das Gebietsschema steuern

Die folgenden Parameter wirken sich auf das Sortierverhalten aus.

babelfishpg_tsql.default_locale

Dieser Parameter gibt das Standardgebietsschema an, das von der Sortierung verwendet wird. Dieser Parameter wird in Kombination mit den Attributen in der Babelfish collation attributes table verwendet, um Sortierungen für eine bestimmte Sprache und Region anzupassen. Der Standardwert für diesen Parameter ist en-US.

Das Standard-Gebietsschema gilt für alle Babelfish-Kollatierungsnamen, die mit "BBF" beginnen, und für alle SQL Server-Sortierungen, die Babelfish-Sortierungen zugeordnet sind. Wenn die Einstellung für diesen Parameter auf einem vorhandenen Babelfish-DB-Cluster geändert wird, hat dies keinen Einfluss auf das Gebietsschema vorhandener Sortierungen. Eine Liste der Sortierungen finden Sie in der Babelfish supported collations table.

babelfishpg_tsql.server_colation_name

Dieser Parameter gibt die Standardsortierung für den Server (Aurora SQL Postgre-DB-Cluster-Instance) und die Datenbank an. Der Standardwert ist sql_latin1_general_cp1_ci_as. server_collation_nameEs muss sich um eine CI_AS Sortierung handeln, da in T- die Serversortierung bestimmtSQL, wie Bezeichner verglichen werden.

Wenn Sie Ihren Babelfish-DB-Cluster erstellen, wählen Sie den Collation name (Name der Sortierung) aus der auswählbaren Liste aus. Dazu gehören die Sortierungen in der Babelfish supported collations table. Ändern Sie nicht das server_collation_name nachdem die Babelfish-Datenbank erstellt wurde.

Die Einstellungen, die Sie bei der Erstellung Ihres Babelfish for Aurora Postgre-DB-Clusters wählen, werden in der SQL DB-Cluster-Parametergruppe gespeichert, die dem Cluster für diese Parameter zugeordnet ist, und legen dessen Kollationsverhalten fest.

Deterministische und nichtdeterministische Kollationen in Babelfish

Babelfish unterstützt deterministische und nicht deterministische Kollationen:

  • Eine deterministische Sortierung wertet Zeichen mit identischen Bytesequenzen als gleich aus. Dies bedeutet, dass x und X bei einer deterministischen Sortierung nicht gleich sind. Deterministische Sortierungen können Groß- und Kleinschreibung (CS) und Akzente (AS) berücksichtigen.

  • Eine nicht deterministische Sortierung erfordert keine identische Übereinstimmung. Eine nicht deterministische Kollation bewertet x und X gleich. Bei nichtdeterministischen Kollationen wird nicht zwischen Groß- und Kleinschreibung unterschieden (CI) oder ohne Akzente (AI) oder beides.

In der folgenden Tabelle finden Sie einige Verhaltensunterschiede zwischen Babelfish und Postgre bei der Verwendung nichtdeterministischer Kollationen. SQL

Babelfish Postgre SQL

Unterstützt die LIKE Klausel für CI_AS-Kollationen.

Unterstützt die LIKE Klausel für nichtdeterministische Kollationen nicht.

Unterstützt die LIKE Klausel nur für die folgenden KI-Kollationen aus Babelfish Version 4.2.0:

  • bbf_unicode_cp1250_ci_ai

  • bbf_unicode_cp1250_cs_ai

  • bbf_unicode_cp1257_ci_ai

  • bbf_unicode_cp1257_cs_ai

  • bbf_unicode_cp1_ci_ai

  • bbf_unicode_cp1_cs_ai

  • estnisch_ci_ai

  • finnisch_schwedisch_ci_ai

  • französisch_ci_ai

  • lateinisch1_general_ci_ai

  • lateinisch1_general_cs_ai

  • moderner_spanisch_ci_ai

  • polnisch_ci_ai

  • sql_lateinisch1_general_cp1_ci_ai

  • sql_latin1_general_cp1_cs_ai

  • traditionelles_spanisch_ci_ai

Unterstützt die Klausel für nichtdeterministische Kollationen nicht. LIKE

Eine Liste weiterer Einschränkungen und Verhaltensunterschiede für Babelfish im Vergleich zu SQL Server und Postgre finden Sie unter. SQL Einschränkungen und Verhaltensunterschiede von Sortierungen

Babelfish und SQL Server folgen einer Namenskonvention für Kollationen, die die Sortierungsattribute beschreiben, wie in der folgenden Tabelle dargestellt.

Attribut Beschreibung

AI

Akzentunempfindlich.

AS

Akzentsensibel.

BIN2

BIN2fordert, dass Daten in der Reihenfolge der Codepunkte sortiert werden. Die Reihenfolge der Unicode-Codepunkte entspricht der Zeichenreihenfolge für die UTF Kodierungen UTF -8, -16 und UCS -2. Die Codepunkt-Reihenfolge ist eine schnelle deterministische Sortierung.

CI

Berücksichtigt Groß- und Kleinschreibung nicht.

CS

Groß-/Kleinschreibung ist zu beachten.

PREF

Verwenden Sie eine Sortierung, um Großbuchstaben vor Kleinbuchstaben zu sortieren. PREF Wenn beim Vergleich die Groß- und Kleinschreibung nicht berücksichtigt wird, wird die Großbuchstabenversion vor der Kleinbuchstabenversion sortiert, wenn keine andere Unterscheidung vorliegt. Die ICU Bibliothek unterstützt die Präferenz für Großbuchstaben bei colCaseFirst=upper CI_AS-Kollationen, jedoch nicht.

PREFkann nur auf deterministische Kollationen angewendet werden. CS_AS

Kollationen werden in Babelfish auf Datenbankebene unterstützt

Die folgenden Kollationen werden auf Datenbankebene in Babelfish unterstützt:

  • bbf_unicode_bin2

  • bbf_unicode_cp1_ci_ai

  • bbf_unicode_cp1_ci_as

  • bbf_unicode_cp1250_ci_ai

  • bbf_unicode_cp1250_ci_as

  • bbf_unicode_cp1257_ci_ai

  • bbf_unicode_cp1257_ci_as

  • estnisch_ci_ai

  • estnisch_ci_as

  • finnisch_schwedisch_ci_ai

  • finnish_swedish_ci_as

  • französisch_ci_ai

  • french_ci_as

  • lateinisch1_general_bin2

  • lateinisch1_general_ci_ai

  • latin1_general_ci_as

  • lateinisch1_general_90_bin2

  • lateinisch1_general_100_bin2

  • lateinisch1_general_140_bin2

  • modernes_spanisch_ci_ai

  • modern_spanish_ci_as

  • polnisch_ci_ai

  • polish_ci_as

  • sql_lateinisch1_general_cp1_ci_ai

  • sql_latin1_general_cp1_ci_as

  • sql_latin1_general_cp1250_ci_as

  • sql_latin1_general_cp1251_ci_as

  • sql_latin1_general_cp1257_ci_as

  • traditionelles_spanisch_ci_ai

  • traditional_spanish_ci_as

Anmerkung

Um eine andere Sortierung auf Datenbankebene zu verwenden, stellen Sie sicher, dass sie mit der Sortierung auf Serverebene übereinstimmt. Weitere Informationen finden Sie unter Server- und Objektkollationen in Babelfish

Server- und Objektkollationen in Babelfish

Verwenden Sie die folgenden Sortierungen als Serversortierung oder Objektsortierung.

Sortier-ID Hinweise

bbf_unicode_general_ci_as

Unterstützt den Vergleich und den Operator ohne Berücksichtigung der Groß- und Kleinschreibung. LIKE

bbf_unicode_cp1_ci_as

Nichtdeterministische Sortierung, auch bekannt als. CP1252

CP125bbf_unicode_ 0_ci_as

Nichtdeterministische Kollation wird verwendet, um Texte in mitteleuropäischen und osteuropäischen Sprachen darzustellen, die lateinische Schrift verwenden.

CP1251bbf_unicode_ci_as

Nichtdeterministische Kollation für Sprachen, die das kyrillische Skript verwenden.

bbf_unicode_cp1253_ci_as

Nichtdeterministische Kollation repräsentierte früher das moderne Griechisch.

bbf_unicode_cp1254_ci_as

Nichtdeterministische Kollation, die Türkisch unterstützt.

bbf_unicode_cp1255_ci_as

Nichtdeterministische Kollation, die Hebräisch unterstützt.

bbf_unicode_cp1256_ci_as

Nichtdeterministische Kollation wird verwendet, um Sprachen zu schreiben, die arabische Schrift verwenden.

bbf_unicode_cp1257_ci_as

Nichtdeterministische Kollationwird verwendet, um estnische, lettische und litauische Sprachen zu unterstützen.

bbf_unicode_cp1258_ci_as

Nichtdeterministische Kollation wird verwendet, um vietnamesische Schriftzeichen zu schreiben.

bbf_unicode_cp874_ci_as

Nichtdeterministische Kollation wrid verwendet, um thailändische Charaktere zu schreiben.

sql_latin1_general_cp1250_ci_as

Nicht deterministische Einzelbyte-Zeichencodierung wird verwendet, um lateinische Zeichen darzustellen.

sql_latin1_general_cp1251_ci_as

Nichtdeterministische Kollation, die lateinische Zeichen unterstützt.

sql_latin1_general_cp1_ci_as

Nichtdeterministische Kollation, die lateinische Zeichen unterstützt.

sql_latin1_general_cp1253_ci_as

Nichtdeterministische Kollation, die lateinische Zeichen unterstützt.

sql_latin1_general_cp1254_ci_as

Nichtdeterministische Kollation, die lateinische Zeichen unterstützt.

sql_latin1_general_cp1255_ci_as

Nichtdeterministische Kollation, die lateinische Zeichen unterstützt.

sql_latin1_general_cp1256_ci_as

Nichtdeterministische Kollation, die lateinische Zeichen unterstützt.

sql_latin1_general_cp1257_ci_as

Nichtdeterministische Kollation, die lateinische Zeichen unterstützt.

sql_latin1_general_cp1258_ci_as

Nichtdeterministische Kollation, die lateinische Zeichen unterstützt.

chinese_prc_ci_as

Nichtdeterministische Kollation, die Chinesisch () unterstützt. PRC

cyrillic_general_ci_as

Nicht deterministische Kollation, die Kyrillisch unterstützt.

finnish_swedish_ci_as

Nicht deterministische Kollatierung, die Finnisch unterstützt.

french_ci_as

Nicht deterministische Kollatierung, die Französisch unterstützt.

japanese_ci_as

Nicht deterministische Sortierung, die Japanisch unterstützt. Wird in Babelfish 2.1.0 und höheren Versionen unterstützt.

korean_wansung_ci_as

Nicht deterministische Sortierung, die Koreanisch unterstützt (mit Wörterbuchsortierung).

latin1_general_ci_as

Nicht deterministische Sortierung, die lateinische Zeichen unterstützt.

modern_spanish_ci_as

Nicht deterministische Kollatierung, die das moderne Spanisch unterstützt.

polish_ci_as

Nicht deterministische Kollatierung, die Polnisch unterstützt.

thai_ci_as

Nicht deterministische Kollatierung, die Thai unterstützt.

traditional_spanish_ci_as

Nicht deterministische Sortierung, die Spanisch unterstützt (traditionelle Sortierung).

turkish_ci_as

Nicht deterministische Kollatierung, die Türkisch unterstützt.

ukrainisch_ci_as

Nicht deterministische Kollatierung, die Ukrainisch unterstützt.

vietnamesisch_ci_as

Nicht deterministische Kollatierung, die Vietnamesen unterstützt.

Sie können die folgenden Sortierungen als Objektsortierungen verwenden.

Dialekt Deterministische Optionen Nicht deterministische Optionen

Arabisch

Arabic_CS_AS

Arabic_CI_AS

Arabisch_CI_AI

Arabisches Alphabet

BBF_Unicode_ _CS_AS CP1256

BBF_Unicode_Pref_ CP1256 _CS_AS

BBF_Unicode_ _CI_AI CP1256

BBF_Unicode_ CP1256 _CS_AI

Binär

lateinisch1_general_bin2

BBF_Unicode_ BIN2

Mittel- und osteuropäische Sprachen, die lateinische Schrift verwenden

BBF_Unicode_ 0_CS_AS CP125

BBFCP125_Unicode_Pref_0_CS_AS

BBF_Unicode_0_CI_AI CP125

BBFCP125_Unicode_0_CS_AI

Chinesisch

Chinesisch_ PRC _CS_AS

Chinesisch_ PRC _CI_AS

Chinesisch_ PRC _CI_AI

Kyrillic_Allgemein

Cyrillic_General_CS_AS

Kyrillisch_General_CI_AS

Kyrillisch_General_CI_AI

Kyrillische Schrift

BBF_Unicode_ _CS_AS CP1251

BBF_Unicode_Pref_ CP1251 _CS_AS

BBF_Unicode_ _CI_AI CP1251

BBF_Unicode_ CP1251 _CS_AI

Estnisch

Estonian_CS_AS

Estnisch_CI_AS

Estnisch_CI_AI

Estnisch, Lettisch und Litauisch

BBFCP1257_Unicode_ _CS_AS

BBF_Unicode_Pref_ CP1257 _CS_AS

BBF_Unicode_ _CI_AI CP1257

BBF_Unicode_ CP1257 _CS_AI

Finnish_Schwedisch

Finnish_Swedish_CS_AS

Finnish_Swedish_CI_AS

Finnisch_Schwedisch_CI_AI

Französisch

französisch_cs_as

French_CI_AS

Französisch_CI_AI

Griechisch

Greek_CS_AS

Griechisch_CI_AS

Griechisch_CI_AI

Hebräisch

BBF_Unicode__CS_AS CP1255

BBF_Unicode_Pref_ CP1255 _CS_AS

Hebrew_CS_AS

BBF_Unicode_ _CI_AI CP1255

BBF_Unicode_ CP1255 _CS_AI

Hebrew_CI_AS

Hebräisch_CI_AI

Japanisch (Babelfish 2.1.0 und höher)

Japanese_CS_AS

Japanisch_CI_AI

Japanese_CI_AS

Korean_Wamsung

Korean_wamsung_cs_as

Koreanisch_Samsung_CI_AS

Koreanisch_Samsung_CI_AI

Lateinische Zeichen für die Codepage CP1252

latin1_general_cs_as

BBF_Unicode_General_CS_AS

BBF_Unicode_General_Pref_CS_AS

BBF_Unicode_Pref_ _CS_AS CP1

BBF_Unicode_ _CS_AS CP1

latin1_general_ci_as

lateinisch1_general_ci_ai

lateinisch1_general_cs_ai

BBF_Unicode_Allgemeine_CI_AI

BBF_Unicode_General_CS_AI

BBF_Unicode_ _CI_AI CP1

BBF_Unicode_ CP1 _CS_AI

Neugriechisch

BBF_Unicode_ _CS_AS CP1253

BBF_Unicode_Pref_ CP1253 _CS_AS

BBF_Unicode_ _CI_AI CP1253

BBF_Unicode_ CP1253 _CS_AI

Modern_Spanisch

Modern_Spanish_CS_AS

Modern_Spanish_CI_AS

Moderne_Spanische_CI_AI

Mongolisch

Mongolisch_CS_AS

Mongolisch_CI_AS

Mongolisch_CI_AI

Polnisch

Polish_CS_AS

Polish_CI_AS

Polnisch_CI_AI

Thailändisch

BBF_Unicode_ _CS_AS CP874

BBF_Unicode_Pref_ CP874 _CS_AS

Thai_cs_as

BBF_Unicode_ _CI_AI CP874

BBF_Unicode_ CP874 _CS_AI

Thai_CI_AS, Thai_CI_AI

Traditional_Spanisch

Traditional_Spanish_CS_AS

Traditionelles_Spanisch_CI_AS

Traditionelles_Spanisch_CI_AI

Türkisch

BBF_Unicode_ _CS_AS CP1254

BBF_Unicode_Pref_ CP1254 _CS_AS

Türkisch_CS_AS

BBF_Unicode_ _CI_AI CP1254

BBF_Unicode_ CP1254 _CS_AI

Turkish_ci_as, Türkisch_CI_AI

Ukrainisch

Ukranian_CS_AS

Ukrainisch_CI_AS

Ukrainisch_CI_AI

Vietnamesisch

BBF_Unicode_ _CS_AS CP1258

BBF_Unicode_Pref_ CP1258 _CS_AS

Vietnamese_CS_AS

BBF_Unicode_ _CI_AI CP1258

BBF_Unicode_ CP1258 _CS_AI

Vietnamesisch_CI_AS

Vietnamesisch_CI_AI

Standardverhalten bei der Sortierung in Babelfish

Bisher lautete die Standardsortierung der sortierbaren Datentypen pg_catalog.default. Die Datentypen und Objekte, die von diesen Datentypen abhängen, werden unter Berücksichtigung der Groß- und Kleinschreibung sortiert. Dieser Zustand wirkt sich möglicherweise auf die SQL T-Objekte des Datensatzes aus, bei der die Groß- und Kleinschreibung nicht beachtet wird. Ab Babelfish 2.3.0 ist die Standardsortierung für die sortierbaren Datentypen (außer TEXT undNTEXT) dieselbe wie die Sortierung im Parameter. babelfishpg_tsql.server_collation_name Wenn Sie ein Upgrade auf Babelfish 2.3.0 durchführen, wird die Standardsortierung bei der Erstellung des DB-Clusters automatisch ausgewählt, was keine sichtbaren Auswirkungen hat.