PQunescapeBytea() возвращает строку типа x0a для E'\n'::bytea

В библиотеке PostgreSQL libpq (C API) я пытаюсь преобразовать поле bytea, которое возвращается в текстовом представлении, в необработанную двоичную строку.

Например, для одного символа новой строки текстовое представление равно "\\x0a" (т. е. символы '\\', 'x', '0' и 'a' заканчиваются нулевым байтом).

Согласно документации это текстовое представление может быть преобразуется обратно в двоичное представление с помощью PQunescapeBytea(). Однако, когда я использую это, я просто получаю char *, который точно такой же, но с удаленной косой чертой "x0a". Что я делаю неправильно?

char * value  = PGgetvalue(res, row, col);
size_t length = 0;
char * bytes  = PQunescapeBytea(value, &length);
// inspection of 'bytes' for length shows it's the same, with the '\' removed

person d11wtq    schedule 21.09.2012    source источник


Ответы (1)


Ну, машина, на которой я разрабатываю, имеет PostgreSQL 8.4, а сервер - 9.1, который выполняет шестнадцатеричное представление bytea, не понятое клиентом. Мне нужно сделать:

SET bytea_output = escape

Однако, поскольку я не хочу вмешиваться в пользовательские настройки (которые могут даже измениться из-под меня), я решил предоставить резервную реализацию и обойти libpq, когда строка выглядит как новый формат. Префикс пространства имен удален для краткости. Не то чтобы я возвращал Ruby String, поэтому в моем коде есть rb_* и VALUE.

/** Predicate to test of string is of the form \x0afe... */
#define NEW_HEX_P(s, len) (len > 2 && s[0] == '\\' && s[1] == 'x')

/** Lookup table for fast conversion of bytea hex strings to binary data */
static char * HexLookup;

/** Cast from a bytea to a String according to the new (PG 9.0) hex format */
static VALUE cast_bytea_hex(char * hex, size_t len) {
  if ((len % 2) != 0) {
    rb_raise(rb_eRuntimeError,
        "Bad hex value provided for bytea (length not divisible by 2)");
  }

  size_t   buflen = (len - 2) / 2;
  char   * buffer = malloc(sizeof(char) * buflen);
  char   * s      = hex + 2;
  char   * b      = buffer;

  if (buffer == NULL) {
    rb_raise(rb_eRuntimeError,
        "Failed to allocate %ld bytes for bytea conversion", buflen);
  }

  for (; *s; s += 2, ++b)
    *b = (HexLookup[*s] << 4) + (HexLookup[*(s + 1)]);

  VALUE str = rb_str_new(buffer, buflen);
  free(buffer);

  return str;
}

/** Cast from a bytea to a String according to a regular escape format */
static VALUE cast_bytea_escape(char * escaped, size_t len) {
  unsigned char * buffer  = PQunescapeBytea(escaped, &len);

  if (buffer == NULL) {
    rb_raise(rb_eRuntimeError,
        "Failed to allocate memory for PQunescapeBytea() conversion");
  }

  VALUE str = rb_str_new(buffer, len);
  PQfreemem(buffer);

  return str;
}

/** Get the value as a ruby type */
VALUE cast_value(PGresult * res, int row, int col) {
  if (PQgetisnull(res, row, col)) {
    return Qnil;
  }

  char * value  = PQgetvalue(res, row, col);
  int    length = PQgetlength(res, row, col);

  switch (PQftype(res, col)) {
    case INT2OID:
    case INT4OID:
    case INT8OID:
      return rb_cstr2inum(value, 10);

    case BOOLOID:
      return (value[0] == 't') ? Qtrue : Qfalse;

    case BYTEAOID:
      if (NEW_HEX_P(value, length)) {
        return cast_bytea_hex(value, length);
      } else {
        return cast_bytea_escape(value, length);
      }

    default:
      return rb_str_new(value, length);
  }
}

/* Initialize hex decoding lookup table. Must be invoked once, before use. */
void Init_casts(void) {
  HexLookup = malloc(sizeof(char) * 128);

  if (HexLookup == NULL) {
    rb_raise(rb_eRuntimeError,
        "Failed to allocate 128 bytes for internal lookup table");
  }

  char c;

  for (c = '\0'; c < '\x7f'; ++c)
    HexLookup[c] = 0; // Default to NULLs so we don't crash. May be a bad idea.

  for (c = '0'; c <= '9'; ++c)
    HexLookup[c] = c - '0';

  for (c = 'a'; c <= 'f'; ++c)
    HexLookup[c] = 10 + c - 'a';

  for (c = 'A'; c <= 'F'; ++c)
    HexLookup[c] = 10 + c - 'A';
}

Таким образом, в основном, когда я пытаюсь привести значение с OID BYTEAOID, я сначала проверяю, похоже ли оно на новый шестнадцатеричный формат, и если это так, я выполняю декодирование по таблице поиска, в противном случае я просто иду через PQunescapeBytea() как обычно . Вроде и хреново, но это меньшее из двух зол.

Init_casts();

VALUE rubyval = cast_value(res, 1, 6); // Get the ruby type in row 1, column 6
person d11wtq    schedule 21.09.2012