共计 7030 个字符,预计需要花费 18 分钟才能阅读完成。
导读 | 众所周知,C++ 中的 string 使用比较方便,关于 C ++ 中的 string 源码实现可以看我的这篇文章:源码分析 C ++ 的 string 的实现 |
众所周知,C++ 中的 string 使用比较方便,关于 C ++ 中的 string 源码实现可以看我的这篇文章:源码分析 C ++ 的 string 的实现
最近工作中使用 C 语言,但又苦于没有高效的字符串实现,字符串的拼接和裁剪都比较麻烦,而且每个字符串都需要申请内存,内存的申请和释放也很容易出 bug,怎么高效的实现一个不需要处理内存问题并且可以动态扩容进行拼接和裁剪的 string 呢?
一个好的 string 应该有以下功能?
下面来看看各个功能的实现:
首先定义一个 string 的句柄,相当于 C ++ 中的实例
struct c_string;
typedef struct c_string c_string_t;
在内部 string 的实现如下:
// string 的初始内存大小
static const size_t c_string_min_size = 32;
struct c_string {
char *str; // 字符串指针
size_t alloced; // 已分配的内存大小
size_t len; // 字符串的实际长度
};
创建字符串:
c_string_t *c_string_create(void) {
c_string_t *cs;
cs = calloc(1, sizeof(*cs));
cs->str = malloc(c_string_min_size);
*cs->str = '\0';
// 初始分配内存大小是 32,之后每次以 2 倍大小扩容
cs->alloced = c_string_min_size;
cs->len = 0;
return cs;
}
销毁字符串:
void c_string_destroy(c_string_t *cs) {if (cs == NULL) return;
free(cs->str);
free(cs);
}
内部如何扩容呢:
static void c_string_ensure_space(c_string_t *cs, size_t add_len) {if (cs == NULL || add_len == 0) return;
if (cs->alloced >= cs->len + add_len + 1) return;
while (cs->alloced len + add_len + 1) {cs->alloced alloced == 0) {
// 左移到最后可能会变为 0,由于 alloced 是无符号型,减一则会变成 UINT_MAX
cs->alloced--;
}
}
cs->str = realloc(cs->str, cs->alloced);
}
在尾部追加字符串:
void c_string_append_str(c_string_t *cs, const char *str, size_t len) {if (cs == NULL || str == NULL || *str == '\0') return;
if (len == 0) len = strlen(str);
c_string_ensure_space(cs, len); // 确保内部有足够的空间存储字符串
memmove(cs->str + cs->len, str, len);
cs->len += len;
cs->str[cs->len] = '\0';
}
在尾部追加字符:
void c_string_append_char(c_string_t *cs, char c) {if (cs == NULL) return;
c_string_ensure_space(cs, 1);
cs->str[cs->len] = c;
cs->len++;
cs->str[cs->len] = '\0';
}
在尾部追加整数:
void c_string_append_int(c_string_t *cs, int val) {char str[12];
if (cs == NULL) return;
snprintf(str, sizeof(str), "%d", val); // 整数转为字符串
c_string_append_str(cs, str, 0);
}
在头部插入字符串:
void c_string_front_str(c_string_t *cs, const char *str, size_t len) {if (cs == NULL || str == NULL || *str == '\0') return;
if (len == 0) len = strlen(str);
c_string_ensure_space(cs, len);
memmove(cs->str + len, cs->str, cs->len);
memmove(cs->str, str, len);
cs->len += len;
cs->str[cs->len] = '\0';
}
在头部插入字符:
void c_string_front_char(c_string_t *cs, char c) {if (cs == NULL) return;
c_string_ensure_space(cs, 1);
memmove(cs->str + 1, cs->str, cs->len);
cs->str[0] = c;
cs->len++;
cs->str[cs->len] = '\0';
}
在头部插入整数:
void c_string_front_int(c_string_t *cs, int val) {char str[12];
if (cs == NULL) return;
snprintf(str, sizeof(str), "%d", val);
c_string_front_str(cs, str, 0);
}
清空字符串:
void c_string_clear(c_string_t *cs) {if (cs == NULL) return;
c_string_truncate(cs, 0);
}
裁剪字符串:
void c_string_truncate(c_string_t *cs, size_t len) {if (cs == NULL || len >= cs->len) return;
cs->lenlen = len;
cs->str[cs->len] = '\0';
}
删除头部的 N 个字符:
void c_string_drop_begin(c_string_t *cs, size_t len) {if (cs == NULL || len == 0) return;
if (len >= cs->len) {c_string_clear(cs);
return;
}
cs->len -= len;
memmove(cs->str, cs->str + len, cs->len + 1);
}
删除尾部的 N 个字符:
void c_string_drop_end(c_string_t *cs, size_t len) {if (cs == NULL || len == 0) return;
if (len >= cs->len) {c_string_clear(cs);
return;
}
cs->len -= len;
cs->str[cs->len] = '\0';
}
获取字符串的长度:
size_t c_string_len(const c_string_t *cs) {if (cs == NULL) return 0;
return cs->len;
}
返回字符串指针,使用的是内部的内存:
const char *c_string_peek(const c_string_t *cs) {if (cs == NULL) return NULL;
return cs->str;
}
重新分配一块内存存储字符串返回:
char *c_string_dump(const c_string_t *cs, size_t *len) {
char *out;
if (cs == NULL) return NULL;
if (len != NULL) *len = cs->len;
out = malloc(cs->len + 1);
memcpy(out, cs->str, cs->len + 1);
return out;
}
测试代码如下:
int main() {c_string_t *cs = c_string_create(); c_string_append_str(cs, "123", 0); c_string_append_char(cs, '4'); c_string_append_int(cs, 5); printf("%s \n", c_string_peek(cs)); c_string_front_str(cs, "789", 0); printf("%s \n", c_string_peek(cs)); c_string_drop_begin(cs, 2); printf("%s \n", c_string_peek(cs)); c_string_drop_end(cs, 2); printf("%s \n", c_string_peek(cs)); c_string_destroy(cs); return 0; } 输出:12345 78912345 912345 9123 完整代码如下:头文件:#includestruct c_string; typedef struct c_string c_string_t;
c_string_t *c_string_create(void); void c_string_destroy(c_string_t *cs); void c_string_append_str(c_string_t *cs, const char *str, size_t len); void c_string_append_char(c_string_t *cs, char c); void c_string_append_int(c_string_t *cs, int val); void c_string_front_str(c_string_t *cs, const char *str, size_t len); void c_string_front_char(c_string_t *cs, char c); void c_string_front_int(c_string_t *cs, int val); void c_string_clear(c_string_t *cs); void c_string_truncate(c_string_t *cs, size_t len); void c_string_drop_begin(c_string_t *cs, size_t len); void c_string_drop_end(c_string_t *cs, size_t len); size_t c_string_len(const c_string_t *cs); const char *c_string_peek(const c_string_t *cs); char *c_string_dump(const c_string_t *cs, size_t *len);
源文件:
#include#include #include #include #include static const size_t c_string_min_size = 32; struct c_string { char *str; size_t alloced; size_t len; }; c_string_t *c_string_create(void) { c_string_t *cs; cs = calloc(1, sizeof(*cs)); cs->str = malloc(c_string_min_size); *cs->str = '\0'; cs->alloced = c_string_min_size; cs->len = 0; return cs; } void c_string_destroy(c_string_t *cs) {if (cs == NULL) return; free(cs->str); free(cs); }
static void c_string_ensure_space(c_string_t *cs, size_t add_len) {if (cs == NULL || add_len == 0) return; if (cs->alloced >= cs->len + add_len + 1) return; while (cs->alloced len + add_len + 1) {cs->alloced alloced == 0) {cs->alloced--;} } cs->str = realloc(cs->str, cs->alloced); } void c_string_append_str(c_string_t *cs, const char *str, size_t len) {if (cs == NULL || str == NULL || *str == '\0') return; if (len == 0) len = strlen(str); c_string_ensure_space(cs, len); memmove(cs->str + cs->len, str, len); cs->len += len; cs->str[cs->len] = '\0'; }void c_string_append_char(c_string_t *cs, char c) {if (cs == NULL) return; c_string_ensure_space(cs, 1); cs->str[cs->len] = c; cs->len++; cs->str[cs->len] = '\0'; }
void c_string_append_int(c_string_t *cs, int val) {char str[12]; if (cs == NULL) return; snprintf(str, sizeof(str), "%d", val); c_string_append_str(cs, str, 0); } void c_string_front_str(c_string_t *cs, const char *str, size_t len) {if (cs == NULL || str == NULL || *str == '\0') return; if (len == 0) len = strlen(str); c_string_ensure_space(cs, len); memmove(cs->str + len, cs->str, cs->len); memmove(cs->str, str, len); cs->len += len; cs->str[cs->len] = '\0'; }void c_string_front_char(c_string_t *cs, char c) {if (cs == NULL) return; c_string_ensure_space(cs, 1); memmove(cs->str + 1, cs->str, cs->len); cs->str[0] = c; cs->len++; cs->str[cs->len] = '\0'; }
void c_string_front_int(c_string_t *cs, int val) {char str[12]; if (cs == NULL) return; snprintf(str, sizeof(str), "%d", val); c_string_front_str(cs, str, 0); }void c_string_clear(c_string_t *cs) {if (cs == NULL) return; c_string_truncate(cs, 0); }
void c_string_truncate(c_string_t *cs, size_t len) {if (cs == NULL || len >= cs->len) return; cs->lenlen = len; cs->str[cs->len] = '\0'; }
void c_string_drop_begin(c_string_t *cs, size_t len) {if (cs == NULL || len == 0) return; if (len >= cs->len) {c_string_clear(cs); return; } cs->len -= len; /* +1 to move the NULL. */ memmove(cs->str, cs->str + len, cs->len + 1); } void c_string_drop_end(c_string_t *cs, size_t len) {if (cs == NULL || len == 0) return; if (len >= cs->len) {c_string_clear(cs); return; } cs->len -= len; cs->str[cs->len] = '\0'; }size_t c_string_len(const c_string_t *cs) {if (cs == NULL) return 0; return cs->len; }
const char *c_string_peek(const c_string_t *cs) {if (cs == NULL) return NULL; return cs->str; }
char *c_string_dump(const c_string_t *cs, size_t *len) { char *out; if (cs == NULL) return NULL; if (len != NULL) *len = cs->len; out = malloc(cs->len + 1); memcpy(out, cs->str, cs->len + 1); return out; }
正文完
星哥玩云-微信公众号