View a markdown version of this page

Comprendre les classements dans Babelfish pour Aurora PostgreSQL. - Amazon Aurora

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Comprendre les classements dans Babelfish pour Aurora PostgreSQL.

Lorsque vous créez un cluster de bases de données Aurora PostgreSQL avec Babelfish, vous choisissez un classement pour vos données. Un classement spécifie l’ordre de tri et les modèles de bits qui génèrent le texte ou les caractères dans un langage humain écrit donné. Un classement inclut des règles de comparaison des données pour un ensemble donné de modèles de bits. Le classement est lié à la localisation. Les différents paramètres régionaux affectent le mappage des caractères, l’ordre de tri, etc. Les attributs de classement sont reflétés dans les noms des différents classements. Pour plus d’informations sur les attributs, consultez Babelfish collation attributes table.

Babelfish mappe les classements SQL Server à des classements comparables fournis par Babelfish. Babelfish prédéfinit les classements Unicode avec des comparaisons de chaînes et des ordres de tri sensibles aux particularités culturelles. Babelfish fournit également un moyen de traduire les classements de votre base de données SQL Server en classement Babelfish le plus proche. Locale-specific des collations sont fournies pour différentes langues et régions.

Certains classements spécifient une page de code correspondant à un encodage côté client. Babelfish traduit automatiquement l’encodage du serveur vers l’encodage du client en fonction du classement de chaque colonne de sortie.

Babelfish prend en charge les classements répertoriés dans Babelfish supported collations table. Babelfish mappe les classements SQL Server à des classements comparables fournis par Babelfish.

Babelfish utilise la version 153.80 de la bibliothèque de classements ICU (International Components for Unicode. Pour plus d’informations sur les classements ICU, consultez Collation (Classement) dans la documentation ICU. Pour en savoir plus sur PostgreSQL et le classement, consultez Collation Support (Prise en charge des classements) dans la documentation PostgreSQL.

Paramètres de cluster de bases de données qui contrôlent le classement et les paramètres régionaux

Les paramètres suivants ont une incidence sur le comportement du classement.

babelfishpg_tsql.default_locale

Ce paramètre spécifie les paramètres régionaux par défaut utilisés par le classement. Ce paramètre est utilisé en combinaison avec les attributs répertoriés dans Babelfish collation attributes table pour personnaliser les classements liés à une langue et à une région spécifiques. La valeur par défaut de ce paramètre est en-US.

Les paramètres régionaux par défaut s’appliquent à tous les noms de classement Babelfish commençant par « BBF » et à tous les classements SQL Server mappés à des classements Babelfish. La modification de la valeur de ce paramètre sur un cluster de bases de données Babelfish existant n’affecte pas les paramètres régionaux des classements existants. Pour obtenir la liste des classements, consultez Babelfish supported collations table.

babelfishpg_tsql.server_collation_name

Ce paramètre spécifie le classement par défaut du serveur (instance de cluster de bases de données Aurora PostgreSQL) et de la base de données. La valeur par défaut est sql_latin1_general_cp1_ci_as. server_collation_nameIl doit s'agir d'un CI_AS classement car dans T-SQL, le classement du serveur détermine la manière dont les identifiants sont comparés.

Lorsque vous créez votre cluster de bases de données Babelfish, vous choisissez le Collation name (Nom du classement) dans la liste sélectionnable. Il s’agit notamment des classements répertoriés dans Babelfish supported collations table. Ne modifiez pas server_collation_name après la création de la base de données Babelfish.

Les paramètres que vous choisissez lorsque vous créez votre cluster de bases de données Babelfish pour Aurora PostgreSQL sont stockés dans le groupe de paramètres de cluster de bases de données associé au cluster pour ces paramètres et définissent son comportement de classement.

Classements déterministes et non déterministes dans Babelfish

Babelfish prend en charge les classements déterministes et non déterministes :

  • Un classement déterministe considère que les caractères dont les séquences d’octets sont identiques sont égaux. Cela signifie que x et X ne sont pas égaux dans un classement déterministe. Les classements déterministes peuvent être sensibles à la casse (CS) et sensibles aux accents (AS).

  • Un classement non déterministe ne nécessite pas de correspondance identique. Un classement non déterministe considère que x et X sont égaux. Les classements non déterministes sont insensibles à la casse (CI), insensibles aux accents (AI) ou les deux.

Le tableau suivant présente certaines différences de comportement entre Babelfish et PostgreSQL lorsque vous utilisez des classements non déterministes.

Babelfish PostgreSQL

Prend en charge la clause LIKE pour les classements CI_AS.

Ne prend pas en charge la clause LIKE sur les classements non déterministes.

Ne prend en charge la clause LIKE que sur les classements AI suivants issus de la version 4.2.0 de Babelfish :

  • bbf_unicode_cp1250_ci_ai

  • bbf_unicode_cp1250_cs_ai

  • bbf_unicode_cp1257_ci_ai

  • bbf_unicode_cp1257_cs_ai

  • bbf_unicode_cp1_ci_ai

  • bbf_unicode_cp1_cs_ai

  • estonian_ci_ai

  • finnish_swedish_ci_ai

  • french_ci_ai

  • latin1_general_ci_ai

  • latin1_general_cs_ai

  • modern_spanish_ci_ai

  • polish_ci_ai

  • sql_latin1_general_cp1_ci_ai

  • sql_latin1_general_cp1_cs_ai

  • traditional_spanish_ci_ai

Ne prend pas en charge la clause LIKE sur les classements non déterministes.

Pour obtenir la liste des autres limites et différences de comportement pour Babelfish par rapport à SQL Server et PostgreSQL, consultez Limites et différences de comportement des classements.

Babelfish et SQL Server suivent une convention de dénomination pour les classements qui décrivent les attributs de classement, comme indiqué dans le tableau suivant.

Attribut Description

AI

Accent-insensitive.

AS

Accent-sensitive.

BIN2

BIN2 exige que les données soient triées dans l’ordre des points de code. L'ordre des points de code Unicode est le même que l'ordre des caractères pour UTF-8 UTF-16 les UCS-2 encodages. L’ordre des points de code est un classement déterministe rapide.

CI

Case-insensitive.

CS

Case-sensitive.

PREF

Pour trier les majuscules avant les minuscules, utilisez un classement PREF. Si la comparaison est insensible à la casse, la version majuscule d’une lettre est triée avant la version minuscule, à condition qu’il n’y ait pas d’autre distinction. La bibliothèque ICU prend en charge les préférences pour les majuscules avec colCaseFirst=upper, mais pas pour les classements CI_AS.

PREF ne peut être appliqué qu’aux classements déterministes CS_AS.

Classements pris en charge au niveau de la base de données dans Babelfish

Les classements suivants sont pris en charge au niveau de la base de données dans Babelfish :

  • bbf_unicode_bin2

  • bbf_unicode_cp1_ci_ai

  • bbf_unicode_cp1_ci_as

  • bbf_unicode_cp1250_ci_ai

  • bbf_unicode_cp1250_ci_as

  • bbf_unicode_cp1257_ci_ai

  • bbf_unicode_cp1257_ci_as

  • estonian_ci_ai

  • estonian_ci_as

  • finnish_swedish_ci_ai

  • finnish_swedish_ci_as

  • french_ci_ai

  • french_ci_as

  • latin1_general_bin2

  • latin1_general_ci_ai

  • latin1_general_ci_as

  • latin1_general_90_bin2

  • latin1_general_100_bin2

  • latin1_general_140_bin2

  • modern_spanish_ci_ai

  • modern_spanish_ci_as

  • polish_ci_ai

  • polish_ci_as

  • sql_latin1_general_cp1_ci_ai

  • sql_latin1_general_cp1_ci_as

  • sql_latin1_general_cp1250_ci_as

  • sql_latin1_general_cp1251_ci_as

  • sql_latin1_general_cp1257_ci_as

  • traditional_spanish_ci_ai

  • traditional_spanish_ci_as

Note

Pour utiliser un classement différent au niveau de la base de données, assurez-vous qu’il correspond au classement au niveau du serveur. Pour de plus amples informations, consultez Classements de serveur et d’objet dans Babelfish.

Classements de serveur et d’objet dans Babelfish

Utilisez les classements suivants comme classement de serveur ou classement d’objet.

ID du classement Remarques

bbf_unicode_general_ci_as

Prend en charge la comparaison insensible à la casse et l’opérateur LIKE.

bbf_unicode_cp1_ci_as

Classement non déterministe également connu sous le nom de CP1252.

bbf_unicode_CP1250_ci_as

Classement non déterministe permettant de représenter des textes dans les langues d’Europe centrale et d’Europe de l’Est qui utilisent l’alphabet latin.

bbf_unicode_CP1251_ci_as

Classement non déterministe pour les langues utilisant l’alphabet cyrillique.

bbf_unicode_cp1253_ci_as

Classement non déterministe utilisé pour représenter le grec moderne.

bbf_unicode_cp1254_ci_as

Classement non déterministe qui prend en charge le turc.

bbf_unicode_cp1255_ci_as

Classement non déterministe qui prend en charge l’hébreu.

bbf_unicode_cp1256_ci_as

Classement non déterministe pour les langues utilisant l’alphabet arabe.

bbf_unicode_cp1257_ci_as

Classement non déterministe permettant de prendre en charge les langues estonienne, lettone et lituanienne.

bbf_unicode_cp1258_ci_as

Classement non déterministe utilisé pour les caractères vietnamiens.

bbf_unicode_cp874_ci_as

Classement non déterministe utilisé pour les caractères thaïlandais.

sql_latin1_general_cp1250_ci_as

Encodage non déterministe de caractères sur un octet utilisé pour représenter les caractères latins.

sql_latin1_general_cp1251_ci_as

Classement non déterministe prenant en charge les caractères latins.

sql_latin1_general_cp1_ci_as

Classement non déterministe prenant en charge les caractères latins.

sql_latin1_general_cp1253_ci_as

Classement non déterministe prenant en charge les caractères latins.

sql_latin1_general_cp1254_ci_as

Classement non déterministe prenant en charge les caractères latins.

sql_latin1_general_cp1255_ci_as

Classement non déterministe prenant en charge les caractères latins.

sql_latin1_general_cp1256_ci_as

Classement non déterministe prenant en charge les caractères latins.

sql_latin1_general_cp1257_ci_as

Classement non déterministe prenant en charge les caractères latins.

sql_latin1_general_cp1258_ci_as

Classement non déterministe prenant en charge les caractères latins.

chinese_prc_ci_as

Classement non déterministe prenant en charge le chinois (RPC).

cyrillic_general_ci_as

Classement non déterministe prenant en charge l’alphabet cyrillique.

finnish_swedish_ci_as

Classement non déterministe prenant en charge le finnois.

french_ci_as

Classement non déterministe prenant en charge le français.

japanese_ci_as

Classement non déterministe prenant en charge le japonais. Pris en charge dans Babelfish 2.1.0 et versions ultérieures.

korean_wansung_ci_as

Classement non déterministe prenant en charge le coréen (avec tri par dictionnaire).

latin1_general_ci_as

Classement non déterministe prenant en charge les caractères latins.

modern_spanish_ci_as

Classement non déterministe prenant en charge l’espagnol moderne.

polish_ci_as

Classement non déterministe prenant en charge le polonais.

thai_ci_as

Classement non déterministe prenant en charge le thaï.

traditional_spanish_ci_as

Classement non déterministe prenant en charge l’espagnol (tri traditionnel).

turkish_ci_as

Classement non déterministe prenant en charge le turc.

ukrainian_ci_as

Classement non déterministe prenant en charge l’ukrainien.

vietnamese_ci_as

Classement non déterministe prenant en charge le vietnamien.

Vous pouvez utiliser les classements suivants comme classements d’objets.

Langage Options déterministes Options non déterministes

Arabe

Arabic_CS_AS

Arabic_CI_AS

Arabic_CI_AI

Alphabet arabe

BBF_ 1256_CS_AS Unicode_CP

BBF_ 1256_CS_AS Unicode_Pref_CP

BBF_1256_CI_AI Unicode_CP

BBF_1256_CS_AI Unicode_CP

Binaire

latin1_general_bin2

BBF_2 Unicode_BIN

Langues d’Europe centrale et d’Europe de l’Est qui utilisent l’alphabet latin

BBF_1250_CS_AS Unicode_CP

BBF_1250_CS_AS Unicode_Pref_CP

BBF_1250_CI_AI Unicode_CP

BBF_1250_CS_AI Unicode_CP

Chinois

Chinese_PRC_CS_AS

Chinese_PRC_CI_AS

Chinese_PRC_CI_AI

Cyrillic_General

Cyrillic_General_CS_AS

Cyrillic_General_CI_AS

Cyrillic_General_CI_AI

Alphabet cyrillique

BBF_125_CS_AS Unicode_CP

BBF_125_CS_AS Unicode_Pref_CP

BBF_125_CI_AI Unicode_CP

BBF_1252_CS_AI Unicode_CP

Estonian

Estonian_CS_AS

Estonian_CI_AS

Estonian_CI_AI

Estonien, letton et lituanien

BBF_ 1257_CS_AS Unicode_CP

BBF_ 1257_CS_AS Unicode_Pref_CP

BBF_1257_CI_AI Unicode_CP

BBF_1257_CS_AI Unicode_CP

Finnish_Swedish

Finnish_Swedish_CS_AS

Finnish_Swedish_CI_AS

Finnish_Swedish_CI_AI

Français

French_CS_AS

French_CI_AS

French_CI_AI

Grec

Greek_CS_AS

Greek_CI_AS

Greek_CI_AI

Hébreu

BBF_ 1255_CS_AS Unicode_CP

BBF_ 1255_CS_AS Unicode_Pref_CP

Hebrew_CS_AS

BBF_1255_CI_AI Unicode_CP

BBF_1255_CS_AI Unicode_CP

Hebrew_CI_AS

Hebrew_CI_AI

Japonais (Babelfish 2.1.0 et versions ultérieures)

Japanese_CS_AS

Japanese_CI_AI

Japanese_CI_AS

Korean_Wamsung

Korean_Wamsung_CS_AS

Korean_Wamsung_CI_AS

Korean_Wamsung_CI_AI

Caractères latins pour la page de code CP1252

latin1_general_cs_as

BBF_ Unicode_General_CS_AS

BBF_ Unicode_General_Pref_CS_AS

BBF_1_CS_AS Unicode_Pref_CP

BBF_1_CS_AS Unicode_CP

latin1_general_ci_as

latin1_general_ci_ai

latin1_general_cs_ai

BBF_ Unicode_General_CI_AI

BBF_ Unicode_General_CS_AI

BBF_1_CI_AI Unicode_CP

BBF_1_CS_AI Unicode_CP

Grec moderne

BBF_ 1253_CS_AS Unicode_CP

BBF_ 1253_CS_AS Unicode_Pref_CP

BBF_1253_CI_AI Unicode_CP

BBF_1253_CS_AI Unicode_CP

Modern_Spanish

Modern_Spanish_CS_AS

Modern_Spanish_CI_AS

Modern_Spanish_CI_AI

Mongol

Mongolian_CS_AS

Mongolian_CI_AS

Mongolian_CI_AI

Polonais

Polish_CS_AS

Polish_CI_AS

Polish_CI_AI

Thaï

BBF_ 874_CS_AS Unicode_CP

BBF_ 874_CS_AS Unicode_Pref_CP

Thai_CS_AS

BBF_874_CI_AI Unicode_CP

BBF_874-CS_AI Unicode_CP

Thai_CI_AS, Thai_CI_AI

Traditional_Spanish

Traditional_Spanish_CS_AS

Traditional_Spanish_CI_AS

Traditional_Spanish_CI_AI

Turc

BBF_ 1254_CS_AS Unicode_CP

BBF_ 1254_CS_AS Unicode_Pref_CP

Turkish_CS_AS

BBF_1254_CI_AI Unicode_CP

BBF_1254_CS_AI Unicode_CP

Turkish_CI_AS, Turkish_CI_AI

Ukrainien

Ukranian_CS_AS

Ukranian_CI_AS

Ukranian_CI_AI

Vietnamien

BBF_ 1258_CS_AS Unicode_CP

BBF_ 1258_CS_AS Unicode_Pref_CP

Vietnamese_CS_AS

BBF_1258_CI_AI Unicode_CP

BBF_1258_CS_AI Unicode_CP

Vietnamese_CI_AS

Vietnamese_CI_AI

Comportement de classement par défaut dans Babelfish

Auparavant, le classement par défaut des types de données pouvant être classées était pg_catalog.default. Les types de données et les objets qui dépendent de ces types de données sont classés selon le classement sensible à la casse. Cette condition peut avoir un impact sur les T-SQL objets de l'ensemble de données avec un classement qui ne fait pas la distinction majuscules/majuscules. À partir de Babelfish 2.3.0, le classement par défaut pour les types de données pouvant être classées (à l’exception de TEXT et NTEXT) est le même que le classement du paramètre babelfishpg_tsql.server_collation_name. Lorsque vous passez à Babelfish 2.3.0, le classement par défaut est sélectionné automatiquement au moment de la création du cluster de bases de données, ce qui n’a aucun impact visible.