阿里云-云小站(无限量代金券发放中)
【腾讯云】云服务器、云数据库、COS、CDN、短信等热卖云产品特惠抢购

用C实现动态扩容的string

80次阅读
没有评论

共计 7030 个字符,预计需要花费 18 分钟才能阅读完成。

导读 众所周知,C++ 中的 string 使用比较方便,关于 C ++ 中的 string 源码实现可以看我的这篇文章:源码分析 C ++ 的 string 的实现

用 C 实现动态扩容的 string

众所周知,C++ 中的 string 使用比较方便,关于 C ++ 中的 string 源码实现可以看我的这篇文章:源码分析 C ++ 的 string 的实现

最近工作中使用 C 语言,但又苦于没有高效的字符串实现,字符串的拼接和裁剪都比较麻烦,而且每个字符串都需要申请内存,内存的申请和释放也很容易出 bug,怎么高效的实现一个不需要处理内存问题并且可以动态扩容进行拼接和裁剪的 string 呢?

一个好的 string 应该有以下功能?

  • 创建字符串
  • 删除字符串
  • 尾部追加字符串
  • 头部插入字符串
  • 从尾部删除 N 个字符
  • 从头部删除 N 个字符
  • 裁剪字符串
  • 获取字符串长度
  • 获取完整字符串
  • 下面来看看各个功能的实现:

    首先定义一个 string 的句柄,相当于 C ++ 中的实例

    struct c_string;  
    typedef struct c_string c_string_t;

    在内部 string 的实现如下:

    // string 的初始内存大小  
    static const size_t c_string_min_size = 32;  
    struct c_string {  
        char *str; // 字符串指针  
        size_t alloced; // 已分配的内存大小  
        size_t len; // 字符串的实际长度  
    };

    创建字符串:

    c_string_t *c_string_create(void) {  
        c_string_t *cs;  
        cs = calloc(1, sizeof(*cs));  
        cs->str = malloc(c_string_min_size);  
        *cs->str = '\0';  
        // 初始分配内存大小是 32,之后每次以 2 倍大小扩容  
        cs->alloced = c_string_min_size;   
        cs->len = 0; 
        return cs;  
    }

    销毁字符串:

    void c_string_destroy(c_string_t *cs) {if (cs == NULL) return;  
        free(cs->str);  
        free(cs);  
    }

    内部如何扩容呢:

    static void c_string_ensure_space(c_string_t *cs, size_t add_len) {if (cs == NULL || add_len == 0) return;  
        if (cs->alloced >= cs->len + add_len + 1) return;  
        while (cs->alloced len + add_len + 1) {cs->alloced alloced == 0) {  
                // 左移到最后可能会变为 0,由于 alloced 是无符号型,减一则会变成 UINT_MAX  
                cs->alloced--;  
            }  
        }  
        cs->str = realloc(cs->str, cs->alloced);  
    }

    在尾部追加字符串:

    void c_string_append_str(c_string_t *cs, const char *str, size_t len) {if (cs == NULL || str == NULL || *str == '\0') return;  
        if (len == 0) len = strlen(str);  
        c_string_ensure_space(cs, len); // 确保内部有足够的空间存储字符串  
        memmove(cs->str + cs->len, str, len);  
        cs->len += len;  
        cs->str[cs->len] = '\0';  
    }

    在尾部追加字符:

    void c_string_append_char(c_string_t *cs, char c) {if (cs == NULL) return;  
        c_string_ensure_space(cs, 1);  
        cs->str[cs->len] = c;  
        cs->len++;  
        cs->str[cs->len] = '\0';  
    }

    在尾部追加整数:

    void c_string_append_int(c_string_t *cs, int val) {char str[12];  
        if (cs == NULL) return;  
        snprintf(str, sizeof(str), "%d", val); // 整数转为字符串  
        c_string_append_str(cs, str, 0);  
    }

    在头部插入字符串:

    void c_string_front_str(c_string_t *cs, const char *str, size_t len) {if (cs == NULL || str == NULL || *str == '\0') return;  
        if (len == 0) len = strlen(str);  
        c_string_ensure_space(cs, len);  
        memmove(cs->str + len, cs->str, cs->len);  
        memmove(cs->str, str, len); 
        cs->len += len;  
        cs->str[cs->len] = '\0';  
    }

    在头部插入字符:

    void c_string_front_char(c_string_t *cs, char c) {if (cs == NULL) return;  
        c_string_ensure_space(cs, 1);  
        memmove(cs->str + 1, cs->str, cs->len);  
        cs->str[0] = c;  
        cs->len++;  
        cs->str[cs->len] = '\0';  
    }

    在头部插入整数:

    void c_string_front_int(c_string_t *cs, int val) {char str[12];  
        if (cs == NULL) return;  
        snprintf(str, sizeof(str), "%d", val);  
        c_string_front_str(cs, str, 0);  
    }

    清空字符串:

    void c_string_clear(c_string_t *cs) {if (cs == NULL) return;  
        c_string_truncate(cs, 0);  
    }

    裁剪字符串:

    void c_string_truncate(c_string_t *cs, size_t len) {if (cs == NULL || len >= cs->len) return;  
        cs->lenlen = len;  
        cs->str[cs->len] = '\0';  
    }

    删除头部的 N 个字符:

    void c_string_drop_begin(c_string_t *cs, size_t len) {if (cs == NULL || len == 0) return;  
        if (len >= cs->len) {c_string_clear(cs);  
            return;  
        }  
        cs->len -= len;  
        memmove(cs->str, cs->str + len, cs->len + 1);  
    }

    删除尾部的 N 个字符:

    void c_string_drop_end(c_string_t *cs, size_t len) {if (cs == NULL || len == 0) return;  
        if (len >= cs->len) {c_string_clear(cs);  
            return;  
        }  
        cs->len -= len;  
        cs->str[cs->len] = '\0';  
    }

    获取字符串的长度:

    size_t c_string_len(const c_string_t *cs) {if (cs == NULL) return 0;  
        return cs->len;  
    }

    返回字符串指针,使用的是内部的内存:

    const char *c_string_peek(const c_string_t *cs) {if (cs == NULL) return NULL;  
        return cs->str;  
    }

    重新分配一块内存存储字符串返回:

    char *c_string_dump(const c_string_t *cs, size_t *len) {  
        char *out;  
        if (cs == NULL) return NULL;  
        if (len != NULL) *len = cs->len;  
        out = malloc(cs->len + 1);  
        memcpy(out, cs->str, cs->len + 1);  
        return out; 
     }

    测试代码如下:

    int main() {c_string_t *cs = c_string_create();  
        c_string_append_str(cs, "123", 0);  
        c_string_append_char(cs, '4');  
        c_string_append_int(cs, 5);  
        printf("%s \n", c_string_peek(cs));  
        c_string_front_str(cs, "789", 0);  
        printf("%s \n", c_string_peek(cs));  
        c_string_drop_begin(cs, 2);  
        printf("%s \n", c_string_peek(cs));  
        c_string_drop_end(cs, 2);  
        printf("%s \n", c_string_peek(cs));  
        c_string_destroy(cs);  
        return 0;  
    } 
    输出:12345  
    78912345  
    912345  
    9123 
    完整代码如下:头文件:#include   
    struct c_string;  
    typedef struct c_string c_string_t; 
    c_string_t *c_string_create(void);  
    void c_string_destroy(c_string_t *cs);  
    void c_string_append_str(c_string_t *cs, const char *str, size_t len);  
    void c_string_append_char(c_string_t *cs, char c);  
    void c_string_append_int(c_string_t *cs, int val);  
    void c_string_front_str(c_string_t *cs, const char *str, size_t len);  
    void c_string_front_char(c_string_t *cs, char c);  
    void c_string_front_int(c_string_t *cs, int val);  
    void c_string_clear(c_string_t *cs);  
    void c_string_truncate(c_string_t *cs, size_t len);  
    void c_string_drop_begin(c_string_t *cs, size_t len);  
    void c_string_drop_end(c_string_t *cs, size_t len); 
    size_t c_string_len(const c_string_t *cs);  
    const char *c_string_peek(const c_string_t *cs);  
    char *c_string_dump(const c_string_t *cs, size_t *len); 

    源文件:

    #include   
    #include   
    #include   
    #include   
    #include   
    static const size_t c_string_min_size = 32; 
    struct c_string {  
        char *str;  
        size_t alloced;  
        size_t len; 
    };  
    c_string_t *c_string_create(void) {  
        c_string_t *cs;  
        cs = calloc(1, sizeof(*cs));  
        cs->str = malloc(c_string_min_size);  
        *cs->str = '\0';  
        cs->alloced = c_string_min_size;  
        cs->len = 0;  
        return cs;  
    }  void c_string_destroy(c_string_t *cs) {if (cs == NULL) return;  
        free(cs->str);  
        free(cs);  
    } 
    static void c_string_ensure_space(c_string_t *cs, size_t add_len) {if (cs == NULL || add_len == 0) return;  
        if (cs->alloced >= cs->len + add_len + 1) return;  
        while (cs->alloced len + add_len + 1) {cs->alloced alloced == 0) {cs->alloced--;}  
        }  
        cs->str = realloc(cs->str, cs->alloced);  
    }  
    void c_string_append_str(c_string_t *cs, const char *str, size_t len) {if (cs == NULL || str == NULL || *str == '\0') return;  
        if (len == 0) len = strlen(str);  
        c_string_ensure_space(cs, len);  
        memmove(cs->str + cs->len, str, len);  
        cs->len += len;  
        cs->str[cs->len] = '\0';  
    }  void c_string_append_char(c_string_t *cs, char c) {if (cs == NULL) return;  
        c_string_ensure_space(cs, 1);  
        cs->str[cs->len] = c;  
        cs->len++;  
        cs->str[cs->len] = '\0';  
    } 
    void c_string_append_int(c_string_t *cs, int val) {char str[12];  
        if (cs == NULL) return;  
        snprintf(str, sizeof(str), "%d", val);  
        c_string_append_str(cs, str, 0);  
    }  
    void c_string_front_str(c_string_t *cs, const char *str, size_t len) {if (cs == NULL || str == NULL || *str == '\0') return;  
        if (len == 0) len = strlen(str);  
        c_string_ensure_space(cs, len);  
        memmove(cs->str + len, cs->str, cs->len);  
        memmove(cs->str, str, len);  
        cs->len += len;  
        cs->str[cs->len] = '\0';  
    }  void c_string_front_char(c_string_t *cs, char c) {if (cs == NULL) return;  
        c_string_ensure_space(cs, 1);  
        memmove(cs->str + 1, cs->str, cs->len);  
        cs->str[0] = c;  
        cs->len++;  
        cs->str[cs->len] = '\0';  
    } 
    void c_string_front_int(c_string_t *cs, int val) {char str[12]; 
        if (cs == NULL) return;  
        snprintf(str, sizeof(str), "%d", val);  
        c_string_front_str(cs, str, 0);  
    }  void c_string_clear(c_string_t *cs) {if (cs == NULL) return;  
        c_string_truncate(cs, 0);  
    } void c_string_truncate(c_string_t *cs, size_t len) {if (cs == NULL || len >= cs->len) return;  
        cs->lenlen = len;  
        cs->str[cs->len] = '\0';  
    } 
    void c_string_drop_begin(c_string_t *cs, size_t len) {if (cs == NULL || len == 0) return;  
        if (len >= cs->len) {c_string_clear(cs);  
            return;  
        }  
        cs->len -= len;  
        /* +1 to move the NULL. */  
        memmove(cs->str, cs->str + len, cs->len + 1);  
    }  
    void c_string_drop_end(c_string_t *cs, size_t len) {if (cs == NULL || len == 0) return;   
        if (len >= cs->len) {c_string_clear(cs);  
            return;  
        }  
        cs->len -= len;  
        cs->str[cs->len] = '\0';  
    }  size_t c_string_len(const c_string_t *cs) {if (cs == NULL) return 0;  
        return cs->len;  
    } const char *c_string_peek(const c_string_t *cs) {if (cs == NULL) return NULL;  
        return cs->str;  
    } 
    char *c_string_dump(const c_string_t *cs, size_t *len) {  
        char *out;  
        if (cs == NULL) return NULL;  
        if (len != NULL) *len = cs->len;  
        out = malloc(cs->len + 1);  
        memcpy(out, cs->str, cs->len + 1);  
        return out;  
    }  
    

    阿里云 2 核 2G 服务器 3M 带宽 61 元 1 年,有高配

    腾讯云新客低至 82 元 / 年,老客户 99 元 / 年

    代金券:在阿里云专用满减优惠券

    正文完
    星哥玩云-微信公众号
    post-qrcode
     0
    星锅
    版权声明:本站原创文章,由 星锅 于2024-07-25发表,共计7030字。
    转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
    【腾讯云】推广者专属福利,新客户无门槛领取总价值高达2860元代金券,每种代金券限量500张,先到先得。
    阿里云-最新活动爆款每日限量供应
    评论(没有评论)
    验证码
    【腾讯云】云服务器、云数据库、COS、CDN、短信等云产品特惠热卖中